AI在线 AI在线

AGI

循环网络能否提升推理能力?分层推理模型已经问世!

译者 | 晶颜审校 | 重楼通用人工智能(AGI)作为人工智能领域的核心目标,已被学界与产业界广泛探讨多年。 然而,当前主流的大型语言模型(LLMs)即便在性能上表现突出,但在解决复杂推理任务时仍存在显著局限,远未达到AGI所要求的自主推理与问题解决能力。 此类复杂任务往往需要多维度的模式识别、抽象知识生成,以及迭代式的推理能力优化——即便对人类而言,也需投入大量时间与精力方可完成。
9/15/2025 9:43:33 AM
晶颜

大模型不再是“万能钥匙”?探秘 AI 初创公司的新策略与挑战

据techcrunch报道, 曾经被视为 AI 领域“皇冠上的明珠”的基础模型,其主导地位正在面临前所未有的挑战。 AI 初创公司的焦点已悄然转向面向特定任务的定制化模型和用户界面,将基础模型视为可替换的“商品”。 这一趋势在近期的 Boxworks 会议上表现得尤为明显,整个行业似乎正在告别对通用人工智能(AGI)的追逐,转而进入一个分散化、专业化的新时代。
9/15/2025 9:11:35 AM
AI在线

数十亿人将用上免费AGI!OpenAI奥特曼高调断言:全球经济将迎来极度通缩!效率强如DeepSeek,全球AI也需百吉瓦能源!

编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto)奥特曼最新判断来了:未来会有数十亿人使用免费的 AGI! 不只是价格更低,而是以一种前所未有的方式,大规模普及到全球每一个角落。 同时,他认为,AI 所带来的巨大技术红利,将推动全球经济进入极度通缩的状态。
9/10/2025 5:42:29 PM
伊风

2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没

90%人都会的读钟题,顶尖AI全军覆没! AI基准创建者、连续创业者Alek Safar推出了视觉基准测试ClockBench,专注于测试AI的「看懂」模拟时钟的能力。 结果让人吃惊:人类平均准确率89.1%,而参与测试的11个主流大模型最好的成绩仅13.3%。
9/8/2025 6:08:28 PM

Hinton突然对AGI乐观了!“Ilya让他看到了什么吧…”

Hinton突然对AGI变乐观了。 对于AI,他几周前还觉得是养虎为患,最新采访却改口说是一种母亲和婴儿之间的亲密共生关系。 大多数专家认为5-10年后人工智能会比人类更聪明。
9/5/2025 9:04:00 AM

Karpathy盛赞「环境中心」!AGI最后一块拼图开源,大厂豪掷百万锁死

强化学习时代,什么最重要? Karpathy给出了答案,环境! 只有环境,才能让LLM真正进行交互、执行动作、观察结果。
8/29/2025 5:09:30 PM
新智元

GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类

大家好,我是肆〇柒。 今天我们要探讨一篇由 DeepMind 联合 Stanford HAI(斯坦福以人为本人工智能研究院)共同发布的重磅实证研究报告。 这份报告首次对GPT-5的空间智能能力进行了系统性、标准化的全面评估,其结论可能会更加清晰我们对当前AI能力边界的认知。
8/21/2025 2:10:43 PM
肆零柒

OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈

OpenAI的AGI之路,总裁Greg Brockman在最新的访谈中说清楚了——技术层面,从文本生成转向强化学习的推理范式,在现实世界中试错并获取反馈;资源策略上,持续投入大规模计算资源;落地环节,把模型封装成Agent,将模型能力打包成为可审计的服务进程。 图片这场访谈由AI播客Latent Space主持,与Brockman探讨了OpenAI的AGI的整体技术路线与资源策略。 与此同时,OpenAI的落地布局,以及Brockman对未来的思考,也都随着访谈的进行浮出水面。
8/18/2025 5:14:41 PM
量子位

GPT-5遭用户吐槽 “垃圾”:缩放定律失效,AGI梦渐行渐远?

2025 年 8 月,OpenAI 终于推出备受期待的 GPT-5,但其表现并未如市场预期般带来 “革命性突破”,反而让 “AI 进步失速”“缩放定律失效” 的讨论再度升温。 GPT-5 实测:亮点有限,失望声四起YouTube播主 Mrwhosetheboss 的实测显示,GPT-5 并非全面领先:在创建象棋游戏时优于 . GPT-4o-mini-high,撰写视频脚本时强于 GPT-4o,且能根据任务自动匹配最优模型;但在生成 YouTube .
8/18/2025 9:57:30 AM

奥特曼爆冷改口:AGI没用?MIT预测2028年降临,50%概率

算力膨胀、模型堆叠,提示词像燃料一样被反复输入。 AI的脚步没有停下,反而越来越快。 有人预言,AGI遥遥无期,至少要等上半个世纪。
8/14/2025 6:16:24 PM

27M参数逆袭千亿大模型!小而美AI正式挑战OpenAI霸权

一个明显的趋势是,AI圈正在上演一场前所未有的"大卫战歌利亚"的逆袭好戏。 当所有人都在追逐千亿参数的庞然大物时,一个仅有27M参数的"小不点"却悄然打破了游戏规则。 昨天看到一个消息,挺震撼的。
8/5/2025 9:13:12 AM
阿丸笔记

消息称微软与 OpenAI 正进行深入谈判:确保 AGI 时代技术合作

AI在线 7 月 29 日消息,据彭博社援引两位知情人士的话报道,微软正在就一项交易进行深入谈判,该交易将确保其在未来继续获得 OpenAI 的关键技术支持。 消息人士透露,双方正在讨论新的条款,以便即使 OpenAI 宣布实现通用人工智能(AGI,即超越人类智能的人工智能),微软仍能使用其最新模型和技术。 目前,微软与 OpenAI 的现有合同中包含一项条款,一旦 OpenAI 实现 AGI,微软将失去使用该公司部分先进技术的权利。
7/29/2025 9:15:15 PM
远洋

钉钉 CTO 朱鸿:AI 已切换到下半场,垂直领域的 AGI 将很快到来

AI在线 7 月 28 日消息,钉钉今天在 2025 世界人工智能大会上举办了“AI 实干派”专场活动,其中钉钉商业总裁杨猛、钉钉 CTO 朱鸿等嘉宾均出席了此次活动。 活动中朱鸿首先指出,AI 已经从上半场切换到下半场,这是企业数据发挥出 AI 生产力价值的关键时刻。 未来几年内,垂直领域的 AGI(通用人工智能)会很快到来。
7/28/2025 6:26:07 PM
潞源(实习)

手机AGI助手还有多远?移动智能体复合长程任务测试基准与调度系统发布

本文第一作者郭源是上海交通大学计算机系三年级本科生,研究方向为自主智能体和智能体安全。 该工作由上海交通大学与澜舟科技共同完成。 论文标题:Atomic-to-Compositional Generalization for Mobile Agents with A New Benchmark and Scheduling System项目主页:: 到系统级端侧智能多模态大模型 (MLLM) 驱动的 OS 智能体在单屏动作落实(如 ScreenSpot)、短链操作任务(如 AndroidControl)上展现出突出的表现,标志着端侧任务自动化的初步成熟。
7/26/2025 6:23:00 PM
机器之心

MiniMax 创始人闫俊杰:未来 AI 会变得更普惠,AGI 必将实现

AI在线 7 月 26 日消息,据《科创板日报》报道,在 2025 世界人工智能大会主论坛上,MiniMax 的创始人兼 CEO 闫俊杰表示,未来 AI 会多家争鸣,一方面模型会有各自的特点,另一方面 AI 越来越多是 Multi-Agent,也就是多个模型和多个工具。 此外,过去一年越来越多的开源模型在产生影响力,并逼近最好的闭源模型能力。 闫俊杰提到,“未来 AI 会变得更普惠,由于模型的大小与芯片的计算速度成正比,目前训练单模型的成本几乎固定,推理成本在不断降低,未来一两年内最好模型的推理成本有望再降低一个数量级。
7/26/2025 11:54:22 AM
浩渺

消息称蚂蚁集团新设通用人工智能研究中心,一众“明星 AI 新秀”加盟

AI在线 7 月 24 日消息,雷峰网“AI 科技评论”今晚爆料称,蚂蚁集团近日新设了通用人工智能研究中心,隶属于蚂蚁技术研究院,人员包括蓝振忠、武威、吴翼、赵俊博等一众“明星 AI 新秀”,发力 AGI 基础技术研究。 今年年初,就有消息称蚂蚁将设立 AGI 研究部门,不过上半年是隶属于蚂蚁集团 CTO 线,由何征宇直接领导。 这次的调整则是由 AGI 研究转向研究院,并由蓝振忠担任中心主任,赵俊博、吴翼、武威等人向其汇报。
7/24/2025 9:31:29 PM
清源

又一华人面孔!OpenAI 深夜祭Agent大招!背后研究人员曝光!奥特曼:感受AGI!VibePPT将至,Manus晒对比测评

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)又是一个不眠夜! 7 月对于 OpenAI 而言意义非凡,从去年盛传 GPT-5 将会发布,再到近日的被挖角风波,再到 OpenAI 即将推出 AI 浏览器,各种传言全都酝酿在今天凌晨的直播里。 发布前,小编的预期是,肯定是 Agentic 办公类的产品。
7/18/2025 2:43:13 PM

马斯克又大嘴了!Grok 4 真实水平曝光,多项实测翻车,连前端都搞不定,还谈什么AGI?网友怒评:上当了,花大价钱买了个笑话!

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周,Grok 4 的发布给这个盛夏带来了一片狂热。 但太阳底下无新事,宣传往往大于实际。 在发布直播中,马斯克宣称这是“目前地表最强的 AI”,不仅全面超越了所有竞争对手,还在多个测试中打败了人类,比如所谓的 “人类终极考试”(Humanity’s Last Exam)、ARC-AGI 测试、Vending Bench 等。
7/15/2025 6:08:04 PM
云昭