AI在线 AI在线

模型

GPT-5编程专用版发布!独立连续编程7小时,简单任务提速10倍,VS Code就能用

OpenAI Codex编程智能体大升级:推出GPT-5-Codex特化版模型,支持独立连续编程7个小时。 还有IDE插件版,在VS Code、Cursor中都可以使用Codex了。 新模型最牛的地方在于“真·动态思考”能力。
9/16/2025 9:05:14 AM

马斯克的最快AI模型来了

最强不敢说,但最快实锤了! 刚刚,xAI发布Grok 4 Fast,生成速度高达每秒75个 token,比标准版快10倍! 从下面的动图中,我们可以直观地看出差距——当左边的Grok 4还在说“让我想一下的时候”,Grok 4 Fast已经在说:“下一个问题是什么了。
9/16/2025 9:02:00 AM

15年大佬深夜痛哭半小时!氛围编程巨坑曝光,95%程序员沦为「AI保姆」

爆火的「氛围编程」,如今让无数程序员沦为了「AI保姆」。 入行15年,Carla Rover用了Vibe Coding之后,不得不重启项目,爆哭半小时。 或许听起来太离谱,但这是真真实实发生的故事。
9/15/2025 2:49:58 PM

GPT-5是口袋博士?诺奖得主哈萨比斯怒怼奥特曼:博士级AI纯属扯淡!

目前的博士级人工智能就是扯淡! 实属没想到,诺奖得主、谷歌DeepMind CEO哈萨比斯(Demis Hassabis)竟公然怒怼奥特曼。 在最近的访谈中,哈萨比斯公开表示,把如今的LLM称作「博士级智能」,纯属无稽之谈!
9/15/2025 9:13:00 AM

干货!2025年AI Agent超100页全景报告:MCP、RAG、实战案例

知名AI、数据科学家Avi Chawla最近精心整合关于AI Agent的,117页PDF的全景技术报告。 这份报告的内容非常全面,无论是技术新手或老手都能深度了解关于智能体的相关内容。 在基础理论部分,清晰阐述基础概念,深入剖析大模型、RAG与智能体的区别和关系,帮助开发者构建扎实认知根基。
9/15/2025 9:12:40 AM

重磅!5年破解黎曼猜想,10年接管人类认知,AI超级增长曲线揭秘

「如果未来五年内看到 AI 解出黎曼猜想,我一点也不会太惊讶。 」近日,Epoch AI负责人Jaime Sevilla,与公司数据与分析负责人Yafah Edelman在一次播客节目中,为我们揭示了未来十年,AI的发展路线图。 Jaime Sevilla(左)与Yafah Edelman(右)对话谈到了以下问题:我们是否会持续每年5x的算力扩张节奏?
9/15/2025 9:11:00 AM

昔日王者TensorFlow,已死

噫吁嚱! 那个昔日叱咤风云的开源框架——TensorFlow,已然是行将就木了。 如此断言并非空穴来风,而是根据一份冷静的数据洞察所得出的结论。
9/15/2025 9:10:09 AM

啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了

不得了,这个名叫Gauss(高斯)的新AI Agent,有点杀疯了的感觉。 因为它只用了三周的时间,就完成了陶哲轩和Alex Kontorovich提出的数学挑战——在Lean中形式化强素数定理(Prime Number Theorem,PNT)。 要知道,陶哲轩和Kontorovich在2024年1月提出这个挑战后,足足花了18个月(今年7月)的时间,也才取得阶段性的进展。
9/15/2025 9:00:00 AM

突发!苹果AI大失血:Siri前掌门离职,核心团队被挖角,新功能延期到2026

高管出走、人才流失新品发布会因缺乏「AI进展」被投行降级Siri升级延期,新AI功能未就绪Apple Intelligence落地受限……从年中高调,到9月「轻AI」的产品发布,苹果AI近半年来在跌宕中失速。 近日,苹果AI高层再传震荡:前Siri负责人、AI资深高管Robby Walker即将离任。 Walker是AI负责人John Giannandrea的少数直接汇报人之一。
9/15/2025 8:54:00 AM

攻克强化学习「最慢一环」!交大字节联手,让大模型RL训练速度飙升2.6倍

强化学习的训练效率,实在是太低了! 随着DeepSeek、GPT-4o、Gemini等模型的激烈角逐,大模型“深度思考”能力的背后,强化学习(RL)无疑是那把最关键的密钥。 然而,这场竞赛的背后,一个巨大的瓶颈正悄然限制着所有玩家的速度——相较于预训练和推理,RL训练更像一个效率低下的“手工作坊”,投入巨大但产出缓慢。
9/15/2025 8:50:00 AM

一夜刷屏!27岁姚顺雨离职OpenAI,清华姚班天才转型做产品经理?

姚顺雨昨天被传加入腾讯,今早「第37手」和腾讯旗下的「鹅厂黑板报」正式辟谣! 为什么姚顺雨能引起行业如此大的关注? 为什么会传出来一亿人民币的天价薪酬传闻?
9/12/2025 1:00:05 PM

刚刚,字节登顶世界最强图像AI!一手实测原生4K、10图融合,全网玩疯

谷歌Nano Banana一夜爆火之后,各种邪修玩法儿,至今让全网意犹未尽。 等距视角、多图合成、老照片修复、3D手办.......创意脑洞大开,全网玩疯。 谁曾想,短短半个月后,大洋彼岸就杀出来了一个最强逆袭者!
9/12/2025 11:00:09 AM

全新MoE架构!阿里开源Qwen3-Next,训练成本直降九成

大语言模型(LLM),正在进入 Next Level。 周五凌晨,阿里通义团队正式发布、开源了下一代基础模型架构 Qwen3-Next。 总参数 80B 的模型仅激活 3B ,性能就可媲美千问 3 旗舰版 235B 模型,也超越了 Gemini-2.5-Flash-Thinking,实现了模型计算效率的重大突破。
9/12/2025 10:02:21 AM

超越90%城市规划师!清华、MIT等提出人机协作新范式 | Nature子刊

面对日益复杂的城市系统和多元化的社会需求,传统城市规划方法正遭遇瓶颈。 如今,人工智能(AI)正为这个古老而重要的领域带来颠覆性的革新。 近日,由清华大学电子工程系城市科学与计算研究中心、建筑学院与麻省理工学院(MIT)感知城市实验室、美国东北大学等顶尖机构的学者组成的跨学科团队,在国际前沿期刊《自然·计算科学》上发表观点文章,首次系统性地提出了一个由大语言模型(LLM)驱动的智能城市规划框架。
9/12/2025 9:12:00 AM

攻克AI过度思考难题!美团新研究让通过“可验证”过程奖励激活LRM的高效推理

LRM通过简单却有效的RLVR范式,培养了强大的CoT推理能力,但伴随而来的冗长的输出内容,不仅显著增加推理开销,还会影响服务的吞吐量,这种消磨用户耐心的现象被称为“过度思考”问题。 针对这一缺陷,来自美团等机构的研究团队提出可验证的过程奖励机制(VSRM),鼓励CoT中的“有效步骤”,惩戒“无效步骤”,最大限度保持性能的同时,实现高效推理。 通过在数学任务上的实验显示,在多个常用benchmark上,VSRM加持的后训练使得不同尺度的模型实现了输出长度的大幅缩减,甚至在部分情况下提升了模型表现。
9/12/2025 9:05:00 AM

国产类脑大模型适配国产沐曦GPU!长序列推理提速超百倍,仅用2%数据匹敌主流模型

超长序列推理时的巨大开销如何降低? 中国科学院自动化所李国齐、徐波团队发布的类脑脉冲大模型SpikingBrain (瞬悉)-1.0提出了新思路。 SpikingBrain借鉴大脑信息处理机制,具有线性/近线性复杂度,在超长序列上具有显著速度优势。
9/12/2025 9:03:00 AM

成立7个月首发声!百亿美金独角兽万字雄文:攻克LLM推理非确定性难题

Thinking  Machines Lab终于放大招了! 刚刚,联合创始人、OpenAI前副总裁Lilian Weng透露:Thinking Machines的第一代旗舰产品名为「Connection Machine」(联结机)。 事情是这样的:今天,Thinking Machines开辟了研究博客专栏「Connectionism」(联结主义),发表了第一篇博客文章「Defeating Nondeterminism in LLM Inference」(击败LLM推理中的非确定性)。
9/11/2025 1:31:41 PM
新智元

李飞飞一年前究竟说了啥?怎么又火了

大语言模型的局限在哪里? AI教母李飞飞这样说:大自然中是没有语言存在的,你不会从天空中直接看到文字。 语言是一种纯粹的生成的信号。
9/11/2025 10:02:33 AM