AI在线 AI在线

理论

一夜刷屏!27岁姚顺雨离职OpenAI,清华姚班天才转型做产品经理?

姚顺雨昨天被传加入腾讯,今早「第37手」和腾讯旗下的「鹅厂黑板报」正式辟谣! 为什么姚顺雨能引起行业如此大的关注? 为什么会传出来一亿人民币的天价薪酬传闻?
9/12/2025 1:00:05 PM

刚刚,谷歌发布71页AI科研报告!6大领域全面超越专家,几小时顶几个月

在最新一篇长达71页的论文里,谷歌给科研界丢下了一颗重磅炸弹。 过去一年,DeepMind的FunSearch已经展示了AI在数学发现中的潜力,MIT等团队也提出了AI co-scientist的概念。 但与这些探索相比,谷歌这次的系统走得更远:它不仅能提出新方法、验证实验结果,还在多个领域超越了顶尖专家。
9/12/2025 11:02:36 AM

刚刚,字节登顶世界最强图像AI!一手实测原生4K、10图融合,全网玩疯

谷歌Nano Banana一夜爆火之后,各种邪修玩法儿,至今让全网意犹未尽。 等距视角、多图合成、老照片修复、3D手办.......创意脑洞大开,全网玩疯。 谁曾想,短短半个月后,大洋彼岸就杀出来了一个最强逆袭者!
9/12/2025 11:00:09 AM

全新MoE架构!阿里开源Qwen3-Next,训练成本直降九成

大语言模型(LLM),正在进入 Next Level。 周五凌晨,阿里通义团队正式发布、开源了下一代基础模型架构 Qwen3-Next。 总参数 80B 的模型仅激活 3B ,性能就可媲美千问 3 旗舰版 235B 模型,也超越了 Gemini-2.5-Flash-Thinking,实现了模型计算效率的重大突破。
9/12/2025 10:02:21 AM

文心X1.1事实性暴涨35%25!国产AI首次正面硬刚GPT-5

有朋友问我,最近AI圈有没有什么重磅消息。 我想了想,可能是百度刚发布的文心X1.1,这个模型有点不一样。 说实话,国产AI模型这几年虽然发展很快,但在核心能力上要说能正面挑战GPT这样的国际顶级模型,我一直持保留态度。
9/12/2025 9:21:58 AM
阿丸笔记

超越90%城市规划师!清华、MIT等提出人机协作新范式 | Nature子刊

面对日益复杂的城市系统和多元化的社会需求,传统城市规划方法正遭遇瓶颈。 如今,人工智能(AI)正为这个古老而重要的领域带来颠覆性的革新。 近日,由清华大学电子工程系城市科学与计算研究中心、建筑学院与麻省理工学院(MIT)感知城市实验室、美国东北大学等顶尖机构的学者组成的跨学科团队,在国际前沿期刊《自然·计算科学》上发表观点文章,首次系统性地提出了一个由大语言模型(LLM)驱动的智能城市规划框架。
9/12/2025 9:12:00 AM

ChatGPT支持MCP了!一句Prompt即可全自动化

ChatGPT终于加上了众望所归的MCP支持! 今天,OpenAI正式官宣ChatGPT的MCP功能上线。 目前仅Plus和Pro用户可用。
9/12/2025 9:12:00 AM

Meta超级智能实验室新论文陷争议!被指忽略大量前人研究

Meta超级智能实验室(MSL)又被送上争议的风口浪尖了。 不过,这次不是人事风波,而是他们的第二篇论文《Language Self-Play For Data-Free Training》被质疑忽视前人研究、缺乏创新。 图片究竟是啥论文?
9/12/2025 9:11:54 AM

攻克AI过度思考难题!美团新研究让通过“可验证”过程奖励激活LRM的高效推理

LRM通过简单却有效的RLVR范式,培养了强大的CoT推理能力,但伴随而来的冗长的输出内容,不仅显著增加推理开销,还会影响服务的吞吐量,这种消磨用户耐心的现象被称为“过度思考”问题。 针对这一缺陷,来自美团等机构的研究团队提出可验证的过程奖励机制(VSRM),鼓励CoT中的“有效步骤”,惩戒“无效步骤”,最大限度保持性能的同时,实现高效推理。 通过在数学任务上的实验显示,在多个常用benchmark上,VSRM加持的后训练使得不同尺度的模型实现了输出长度的大幅缩减,甚至在部分情况下提升了模型表现。
9/12/2025 9:05:00 AM

国产类脑大模型适配国产沐曦GPU!长序列推理提速超百倍,仅用2%数据匹敌主流模型

超长序列推理时的巨大开销如何降低? 中国科学院自动化所李国齐、徐波团队发布的类脑脉冲大模型SpikingBrain (瞬悉)-1.0提出了新思路。 SpikingBrain借鉴大脑信息处理机制,具有线性/近线性复杂度,在超长序列上具有显著速度优势。
9/12/2025 9:03:00 AM

DeepDiver-V2来了,华为最新开源原生多智能体系统,“团战”深度研究效果惊人

让智能体组团搞深度研究,效果爆表! 华为最新发布DeepDiver-V2原生多智能体系统。 采用了“团队作战”模式:一个Planner负责任务分解,任务分发,进度审视和成果验收,多个专业Executor并行处理子任务,通过共享文件系统高效交换信息。
9/12/2025 9:01:00 AM

凭什么Nano Banana能霸榜LMArena?​

作者 | 朱先忠审校 | 重楼在AI图像生成领域,每隔一段时间就会有一款“现象级”模型横空出世。 2025年8月,谷歌DeepMind推出的Gemini 2.5 Flash Image,凭借“1-2秒出图”、“98.7%角色一致性”等颠覆性表现,被网友亲切称为“Nano Banana(纳米香蕉)”。 这款模型不仅在LMArena图像编辑榜单上以1362分的成绩刷新纪录,还让普通用户能像“指挥Photoshop学徒”一样用自然语言编辑图像。
9/12/2025 7:13:19 AM
朱先忠

从通用到专精 - 聚焦​ LLMOps 全流程

作者 | 崔皓审校 | 重楼整体思路本文聚焦 LLMOps(大模型运维)全流程实践,从一大模型微调的例子切入,串联起从数据准备到模型部署落地的完整链路。 通过模拟业务人员上传微调数据,借助 Jenkins 工作流驱动一系列自动化操作,展现大模型从研发优化到实际应用的全生命周期管理逻辑,帮大家理解大模型开发微调中如何实现 LLMOps 的全流程。 例子通过模型微调的方式,让 Qwen2 大模型 “认知” 自身为 “微调小助手,由小明创造”。
9/12/2025 7:01:21 AM
崔皓

量子宇宙模拟竞赛开启:量子计算机可以模拟并阐明复杂物理现象

编辑丨%近期,在模拟和数字量子模拟方面都取得了进展,预示着量子计算机能够模拟——从而阐明——即使是功能最强大的超级计算机也无法处理的复杂物理现象的未来。 使用普通计算机创建对世界的真实模拟是不可能的。 因而,模拟物理现实成为了量子计算机的原始、明确目的。
9/11/2025 3:57:00 PM
ScienceAI

兼顾准确率与可解释性,DeepSEA实现抗生素耐药蛋白注释范式转变

编辑丨&传统监测抗菌耐药(AMR)常靠序列比对:有相似参考就能识别,没有就白瞎了。 这种「参考驱动」的策略一方面可靠,另一方面也很脆弱——数据库里没有代表性的参考序列,就很容易把真正的耐药蛋白漏掉(假阴性)——尤其是当耐药蛋白多样性超出已知的参考范畴。 为此,巴西圣保罗大学(University of São Paulo)等的研究者训练了一个卷积神经网络(CNN)以区分抗微生物耐药性蛋白和非耐药性蛋白,将其命名为 DeepSEA。
9/11/2025 2:29:00 PM
ScienceAI

交互扩展时代来临:创智复旦字节重磅发布AgentGym-RL,昇腾加持,开创智能体训练新范式

强化学习之父、2024 年 ACM 图灵奖得主 Richard Sutton 曾指出,人工智能正在迈入「经验时代」—— 在这个时代,真正的智能不再仅仅依赖大量标注数据的监督学习,而是来源于在真实环境中主动探索、不断积累经验的能力。 正如人类通过实践理解世界、优化行为一样,智能体也必须在交互中积累经验、改进策略,才能掌握长期决策的能力。 无独有偶,特斯拉前 AI 负责人,OpenAI 联合创始人 Andrej Karpathy 进一步指出,环境的多样性与真实性,是智能体获得泛化能力、应对复杂任务的关键前提。
9/11/2025 1:46:59 PM

ChatGPT能随便连MCP了!对话就能开发票、帮退款…奥特曼的野心毕露:将OpenAI打造成全能型平台!开发者:太危险了不敢用

出品 | 51CTO技术栈(微信号:blog51cto)起猛了,ChatGPT 现在真的能随便连 MCP 了! 今天,OpenAI 宣布在 ChatGPT 中上线 开发者模式(Developer Mode),为 MCP 工具提供完整支持。 在这一模式下,开发者不仅可以自己创建 MCP 连接器,还能在聊天中调用它们执行写入操作——不再局限于过去的“搜索/获取”类功能。
9/11/2025 1:39:14 PM
伊风

Kimi开源又放大招!20秒更新万亿参数的中间件来了

Kimi开源又双叒放大招了! 一个中间件,就能让Kimi K2的万亿模型参数进入“秒更时代”。 图片不仅支持一次性把更新完的权重从一个节点同时发送给所有节点,还能实现点对点动态更新。
9/11/2025 1:33:52 PM