AI在线 AI在线

理论

Meta超级智能实验室新论文陷争议!被指忽略大量前人研究

Meta超级智能实验室(MSL)又被送上争议的风口浪尖了。 不过,这次不是人事风波,而是他们的第二篇论文《Language Self-Play For Data-Free Training》被质疑忽视前人研究、缺乏创新。 图片究竟是啥论文?
9/12/2025 9:11:54 AM

攻克AI过度思考难题!美团新研究让通过“可验证”过程奖励激活LRM的高效推理

LRM通过简单却有效的RLVR范式,培养了强大的CoT推理能力,但伴随而来的冗长的输出内容,不仅显著增加推理开销,还会影响服务的吞吐量,这种消磨用户耐心的现象被称为“过度思考”问题。 针对这一缺陷,来自美团等机构的研究团队提出可验证的过程奖励机制(VSRM),鼓励CoT中的“有效步骤”,惩戒“无效步骤”,最大限度保持性能的同时,实现高效推理。 通过在数学任务上的实验显示,在多个常用benchmark上,VSRM加持的后训练使得不同尺度的模型实现了输出长度的大幅缩减,甚至在部分情况下提升了模型表现。
9/12/2025 9:05:00 AM

国产类脑大模型适配国产沐曦GPU!长序列推理提速超百倍,仅用2%数据匹敌主流模型

超长序列推理时的巨大开销如何降低? 中国科学院自动化所李国齐、徐波团队发布的类脑脉冲大模型SpikingBrain (瞬悉)-1.0提出了新思路。 SpikingBrain借鉴大脑信息处理机制,具有线性/近线性复杂度,在超长序列上具有显著速度优势。
9/12/2025 9:03:00 AM

DeepDiver-V2来了,华为最新开源原生多智能体系统,“团战”深度研究效果惊人

让智能体组团搞深度研究,效果爆表! 华为最新发布DeepDiver-V2原生多智能体系统。 采用了“团队作战”模式:一个Planner负责任务分解,任务分发,进度审视和成果验收,多个专业Executor并行处理子任务,通过共享文件系统高效交换信息。
9/12/2025 9:01:00 AM

凭什么Nano Banana能霸榜LMArena?​

作者 | 朱先忠审校 | 重楼在AI图像生成领域,每隔一段时间就会有一款“现象级”模型横空出世。 2025年8月,谷歌DeepMind推出的Gemini 2.5 Flash Image,凭借“1-2秒出图”、“98.7%角色一致性”等颠覆性表现,被网友亲切称为“Nano Banana(纳米香蕉)”。 这款模型不仅在LMArena图像编辑榜单上以1362分的成绩刷新纪录,还让普通用户能像“指挥Photoshop学徒”一样用自然语言编辑图像。
9/12/2025 7:13:19 AM
朱先忠

从通用到专精 - 聚焦​ LLMOps 全流程

作者 | 崔皓审校 | 重楼整体思路本文聚焦 LLMOps(大模型运维)全流程实践,从一大模型微调的例子切入,串联起从数据准备到模型部署落地的完整链路。 通过模拟业务人员上传微调数据,借助 Jenkins 工作流驱动一系列自动化操作,展现大模型从研发优化到实际应用的全生命周期管理逻辑,帮大家理解大模型开发微调中如何实现 LLMOps 的全流程。 例子通过模型微调的方式,让 Qwen2 大模型 “认知” 自身为 “微调小助手,由小明创造”。
9/12/2025 7:01:21 AM
崔皓

量子宇宙模拟竞赛开启:量子计算机可以模拟并阐明复杂物理现象

编辑丨%近期,在模拟和数字量子模拟方面都取得了进展,预示着量子计算机能够模拟——从而阐明——即使是功能最强大的超级计算机也无法处理的复杂物理现象的未来。 使用普通计算机创建对世界的真实模拟是不可能的。 因而,模拟物理现实成为了量子计算机的原始、明确目的。
9/11/2025 3:57:00 PM
ScienceAI

兼顾准确率与可解释性,DeepSEA实现抗生素耐药蛋白注释范式转变

编辑丨&传统监测抗菌耐药(AMR)常靠序列比对:有相似参考就能识别,没有就白瞎了。 这种「参考驱动」的策略一方面可靠,另一方面也很脆弱——数据库里没有代表性的参考序列,就很容易把真正的耐药蛋白漏掉(假阴性)——尤其是当耐药蛋白多样性超出已知的参考范畴。 为此,巴西圣保罗大学(University of São Paulo)等的研究者训练了一个卷积神经网络(CNN)以区分抗微生物耐药性蛋白和非耐药性蛋白,将其命名为 DeepSEA。
9/11/2025 2:29:00 PM
ScienceAI

交互扩展时代来临:创智复旦字节重磅发布AgentGym-RL,昇腾加持,开创智能体训练新范式

强化学习之父、2024 年 ACM 图灵奖得主 Richard Sutton 曾指出,人工智能正在迈入「经验时代」—— 在这个时代,真正的智能不再仅仅依赖大量标注数据的监督学习,而是来源于在真实环境中主动探索、不断积累经验的能力。 正如人类通过实践理解世界、优化行为一样,智能体也必须在交互中积累经验、改进策略,才能掌握长期决策的能力。 无独有偶,特斯拉前 AI 负责人,OpenAI 联合创始人 Andrej Karpathy 进一步指出,环境的多样性与真实性,是智能体获得泛化能力、应对复杂任务的关键前提。
9/11/2025 1:46:59 PM

ChatGPT能随便连MCP了!对话就能开发票、帮退款…奥特曼的野心毕露:将OpenAI打造成全能型平台!开发者:太危险了不敢用

出品 | 51CTO技术栈(微信号:blog51cto)起猛了,ChatGPT 现在真的能随便连 MCP 了! 今天,OpenAI 宣布在 ChatGPT 中上线 开发者模式(Developer Mode),为 MCP 工具提供完整支持。 在这一模式下,开发者不仅可以自己创建 MCP 连接器,还能在聊天中调用它们执行写入操作——不再局限于过去的“搜索/获取”类功能。
9/11/2025 1:39:14 PM
伊风

Kimi开源又放大招!20秒更新万亿参数的中间件来了

Kimi开源又双叒放大招了! 一个中间件,就能让Kimi K2的万亿模型参数进入“秒更时代”。 图片不仅支持一次性把更新完的权重从一个节点同时发送给所有节点,还能实现点对点动态更新。
9/11/2025 1:33:52 PM

成立7个月首发声!百亿美金独角兽万字雄文:攻克LLM推理非确定性难题

Thinking  Machines Lab终于放大招了! 刚刚,联合创始人、OpenAI前副总裁Lilian Weng透露:Thinking Machines的第一代旗舰产品名为「Connection Machine」(联结机)。 事情是这样的:今天,Thinking Machines开辟了研究博客专栏「Connectionism」(联结主义),发表了第一篇博客文章「Defeating Nondeterminism in LLM Inference」(击败LLM推理中的非确定性)。
9/11/2025 1:31:41 PM
新智元

聚焦结构化注意力,探索提升多模态大模型文档问答性能

本文聚焦多模态大语言模型(MLLMs)在文档问答(DocQA)任务中的性能提升,提出无需改动模型架构或额外训练的结构化输入方法,通过保留文档层次结构与空间关系(如标题、表格、图像位置)优化理解能力。 研究发现,传统无结构OCR输入导致注意力分散,性能下降,而 LaTeX 范式结构化输入显著提升表现。 注意力分析揭示其诱导“结构化注意力”,减少无关区域干扰,聚焦语义核心。
9/11/2025 1:23:28 PM
互联网算法团队

科技赋能骑手权益保障:饿了么、美团、京东外卖算法优化升级

在即时配送行业高速发展的背景下,头部平台正通过算法优化与劳动规则重构,探索科技与人文关怀的平衡点。 9月10日,饿了么在上海召开算法和劳动规则协商恳谈会,联合多方代表签署《2025年度算法和劳动规则协议》,覆盖超400万骑手群体,标志着行业在劳动者权益保障领域迈出关键一步。 饿了么算法改革:从“负向约束”到“正向激励”此次协议的核心突破在于管理机制的颠覆性变革。
9/11/2025 1:13:43 PM
极客AI

王坚最新演讲曝光:开源正在进入资源时代,AI不能缺席太空,曝近期进展:三体计算星座分享太空!几年后太阳卫星;AI闭源是历史性错误

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)“只有把AI和算力送入太空,人类才有可能真正的走出地球! ”“开源已经进入了开放资源时代! ”“OpenAI闭源并不是一个策略性的错误,而是一个历史的选择。
9/11/2025 12:23:22 PM
云昭

人工智能寒冬即将来临

规模给了我们工具,而不是思想。 这就是残酷的事实。 语言模型规模越来越大,并不能让我们更接近通用智能。
9/11/2025 10:35:28 AM
晓晓

世界首富换人!81岁硅谷狂人4000亿身价碾压马斯克,33岁华裔才女逆袭

世界首富,一夜易主! 昨晚,甲骨文创始人Larry Ellison净资产暴增超1000亿,创有史以来单日最大财富增长纪录。 如今,他的身价高达3930亿美元,超越马斯克(3850亿美元),登顶全球首富。
9/11/2025 10:05:06 AM

李飞飞一年前究竟说了啥?怎么又火了

大语言模型的局限在哪里? AI教母李飞飞这样说:大自然中是没有语言存在的,你不会从天空中直接看到文字。 语言是一种纯粹的生成的信号。
9/11/2025 10:02:33 AM