AI在线 AI在线

理论

微软大裁员不是终点,而是AI筛选人才的起点

“我们都需要使用 AI 工具。 ” 在裁员风暴席卷后的员工会议上,微软美洲中小企业销售主管特拉维斯・沃尔特的话像一道命令。 他推荐的内部 AI 工具,号称能帮销售人员自动生成方案、抓取客户信息,但潜台词却再清晰不过:学不会这些,下一波裁员名单上可能就有你。
7/10/2025 9:31:43 AM

微软开源新版Phi-4:推理效率暴涨10倍,笔记本可运行

今天凌晨,微软在官网开源了Phi-4家族的最新版本Phi-4-mini-flash-reasoning。 mini-flash版延续了Phi-4家族参数小性能强的特点,是专门针对那些受算力、内存和延迟限制场景设计的,单个GPU可运行,适合笔记本、平板电脑等边缘设备。 与前一个版本相比,mini-flash使用了微软自研的创新架构SambaY,推理效率暴涨了10倍,延迟平均降低了2—3倍,整体推理性能实现了大幅度提升。
7/10/2025 9:14:37 AM

ASTRO:赋予语言模型搜索式推理能力的创新框架

大家好,我是肆〇柒。 当下大型语言模型(LLM)已深度融入诸多领域,从智能写作到语言翻译,从智能客服到数据分析,其影响力无处不在。 然而,在处理复杂问题时,推理能力的强弱直接决定了模型的实用性。
7/10/2025 9:14:11 AM
肆零柒

登《Cell》,中科院高彩霞等开发AiCE:一种AI蛋白质工程通用策略

编辑丨&蛋白质工程长期受限于低成功率与高成本,理想的蛋白质工程策略需要以最少的工作量实现最佳性能。 当前基于 AI 的蛋白质工程技术通常计算量大,因此迫切需要更易于使用且用户友好的替代方案,这些方案需要保持预测的准确性并在研究社区推广使用。 中国科学院高彩霞团队开发的 AiCE(AI-informed constraints for protein engineering)框架通过将结构和进化约束整合到通用反向折叠模型中,实现了快速高效的蛋白质进化,无需专门训练。
7/8/2025 6:23:00 PM
ScienceAI

控制成本降低150%,用于微型反应堆的强化学习模型

编辑丨@在能源危机的当下,核能,或者说,微型核反应堆(后称核微反应堆)凭借规模化优势,成为了当下可再生能源的一大重要供应来源。 通常来说,核微反应堆的经济可行性取决于通过自主控制技术降低成本,尤其是这些反应堆与其他能源系统协同运行的时候。 密歇根大学研究人员领导了一项研究,探讨了深度强化学习(RL)模型在微反应器实时鼓控制中,特别是在负荷跟随场景中的性能。
7/7/2025 6:44:00 PM
ScienceAI

让AI自主设计并执行生物实验,机器人生物学家开启实验室自动化新时代

编辑 | ScienceAI在生物研究中,重复性实验如细胞培养、优化参数往往耗时耗力,且受人为误差影响。 传统自动化方案(如液体处理机器人)虽能辅助,却缺乏灵活性 —— 面对复杂协议、动态实验条件时,常需人工干预,难以自主应对错误或优化设计。 如何让 AI 真正 “理解” 并执行生物实验,成为科研加速的关键瓶颈。
7/7/2025 2:18:00 PM
ScienceAI

精度高,速度快!西湖大学团队开发端到端电子显微镜图像分析深度学习模型

编辑 | 萝卜皮冷冻电镜拍图虽然很高清,但是 AI 解结构却像新手拼乐高——步骤繁琐易跑偏,算力烧钱还挑数据。 为了应对这些挑战,西湖大学与新加坡国立大学的研究人员提出了 end-to-end and efficient CryoFold(E3-CryoFold),这是一种支持端到端训练和一次性推理的深度学习方法。 E3-CryoFold 使用三维和序列 Transformer 从密度图和序列中提取特征,并使用交叉注意力模块整合这两种模态。
7/7/2025 10:19:00 AM
ScienceAI

与一支由虚拟科学家组成的 AI 团队共事是怎样的体验?

编辑丨%4 月的一个星期天早上,病理学家托马斯·蒙廷 (Thomas Montine) 召开了他一生中最超现实的会议之一。 在一个名为 Virtual Lab 的系统的在线测试界面中,Montine 构建了一个由六个人工智能(AI)角色组成的团队,所有角色都由商业大型语言模型提供支持。 他赋予了这些模型全新的身份:一对神经科学家,一位是神经药理学家,另一位是药物化学家。
7/7/2025 10:11:00 AM
ScienceAI

首个GUI多模态大模型智能体可信评测框架+基准:MLA-Trust

MLA-Trust 是首个针对图形用户界面(GUI)环境下多模态大模型智能体(MLAs)的可信度评测框架。 该研究构建了涵盖真实性、可控性、安全性与隐私性四个核心维度的评估体系,精心设计了 34 项高风险交互任务,横跨网页端与移动端双重测试平台,对 13 个当前最先进的商用及开源多模态大语言模型智能体进行深度评估,系统性揭示了 MLAs 从静态推理向动态交互转换过程中所产生的可信度风险。 此外,MLA-Trust 提供了高度模块化且可扩展的评估工具箱,旨在为多样化交互环境中 MLAs 的持续性可信度评估提供技术支撑。
7/4/2025 4:50:07 PM

10分钟搞定Excel世锦赛难题!首个超越人类Excel Agent,网友:想给它磕一个

前段时间,我们报道了 5 款大模型参加了今年山东高考的事儿,为了弄清楚各大模型在 9 个科目中的具体表现,我们对着测评明细表挨个儿分析,搞得狼狈又崩溃。 要是哪个 AI 能一键分析表格,我当场就能给它磕一个。 现在,终于有 AI 来整顿 Excel 表格了!
7/4/2025 4:47:35 PM

Agent RL和智能体自我进化的关键一步:TaskCraft实现复杂智能体任务的自动生成

近年来,基于智能体的强化学习(Agent RL)与智能体优化(Agent Optimization)在学术界引发了广泛关注。 然而,实现具备工具调用能力的端到端智能体训练,首要瓶颈在于高质量任务数据的极度稀缺。 当前如 GAIA 与 BrowserComp 等主流数据集在构建过程中高度依赖人工标注,因而在规模与任务复杂性方面均存在明显限制——BrowserComp 仅涵盖约 1300 个搜索任务,GAIA 则仅提供约 500 条多工具协同任务样本。
7/4/2025 4:46:57 PM

4000万样本炼出AI读心术,刷新七榜SOTA,最强「人类偏好感应器」开源

AI,到处都是AI! 早上起来,脑子里突然萦绕起一个旋律,于是便对着AI随便哼了几句让它找出来是哪首歌;到公司之后,打开电脑里的AI,开始准备关于昨天工作的汇报。 只见你熟练地敲入:「根据以下这些文档,写一份总结,要专业、有逻辑、内容简洁」。
7/4/2025 4:45:24 PM

Ilya尘封10年录音曝光!大二入Hinton门下,竟坦言机器学习反直觉

Ilya Sutskever因在深度学习方面的远见卓识而闻名。 他现在许多广为流传的言论其实都来自于他在2023年参加Dwarkesh播客时的发言。 此后,直到2025年Ilya创办SSI后,几乎不再有公开的言论,此前曾探讨过Ilya的去向。
7/4/2025 4:39:56 PM

百万年薪遍地走,Meta薪资接连曝光!AI人才身价水涨船高ing

20000000美金,码农身价堪比NBA球星? 就在小扎顶配高薪挖人之际,Meta各岗位薪资被接连曝出。 先是一份联邦文件曝光,将Meta包括AI研究科学家、软件工程师、产品经理等在内的岗位基本工资一次性大揭底。
7/4/2025 4:37:50 PM

硅谷的企业级AI正在这样赚钱|2025人工智能现状报告

企业级AI开发现状如何? 各企业在使用AI的战略上有什么变化? AI公司应该作出什么样的调整来应对挑战?
7/4/2025 4:34:43 PM

开源大佬炮轰MCP:我不是MCP的忠实拥趸!MCP是一个死胡同!根本不是为无推理自动化而设计的!绕开MCP,试试代码生成的世界

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)今天凌晨,知名开源 Web 框架作者 Ronacher 发表了一篇引起热烈反响的博客。 虽然他自谦地在X上称这篇“烂文章”,但网友们却非常认同。 图片这篇文章标题为:《Tools:Code is all your need》。
7/4/2025 12:35:32 PM
云昭

LeCun团队揭示LLM语义压缩本质:统计压缩牺牲细节

当我们读到“苹果”“香蕉”“西瓜”这些词,虽然颜色不同、形状不同、味道也不同,但仍会下意识地归为“水果”。 哪怕是第一次见到“火龙果”这个词,也能凭借语义线索判断它大概也是一种水果。 这种能力被称为语义压缩,它让我们能够高效地组织知识、迅速地对世界进行分类。
7/4/2025 9:53:57 AM

AI代码工具大地震:Anthropic核心创始人集体"叛逃"Cursor背后的惊天内幕

昨天在Twitter上看到一条消息,差点让我手中的咖啡洒出来——Claude Code的创始人@bcherny和@_catwu离开了Anthropic,加入了Cursor AI。 这感觉就像是你精心培养的孩子,突然跑到隔壁邻居家说"爸爸,我要跟着他们混了"。 作为一个天天和各种AI编程工具打交道的开发者,我深知这件事背后的分量。
7/4/2025 9:21:50 AM
阿丸笔记