AGI
循环网络能否提升推理能力?分层推理模型已经问世!
译者 | 晶颜审校 | 重楼通用人工智能(AGI)作为人工智能领域的核心目标,已被学界与产业界广泛探讨多年。 然而,当前主流的大型语言模型(LLMs)即便在性能上表现突出,但在解决复杂推理任务时仍存在显著局限,远未达到AGI所要求的自主推理与问题解决能力。 此类复杂任务往往需要多维度的模式识别、抽象知识生成,以及迭代式的推理能力优化——即便对人类而言,也需投入大量时间与精力方可完成。
9/15/2025 9:43:33 AM
晶颜
大模型不再是“万能钥匙”?探秘 AI 初创公司的新策略与挑战
据techcrunch报道, 曾经被视为 AI 领域“皇冠上的明珠”的基础模型,其主导地位正在面临前所未有的挑战。 AI 初创公司的焦点已悄然转向面向特定任务的定制化模型和用户界面,将基础模型视为可替换的“商品”。 这一趋势在近期的 Boxworks 会议上表现得尤为明显,整个行业似乎正在告别对通用人工智能(AGI)的追逐,转而进入一个分散化、专业化的新时代。
9/15/2025 9:11:35 AM
AI在线
数十亿人将用上免费AGI!OpenAI奥特曼高调断言:全球经济将迎来极度通缩!效率强如DeepSeek,全球AI也需百吉瓦能源!
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto)奥特曼最新判断来了:未来会有数十亿人使用免费的 AGI! 不只是价格更低,而是以一种前所未有的方式,大规模普及到全球每一个角落。 同时,他认为,AI 所带来的巨大技术红利,将推动全球经济进入极度通缩的状态。
9/10/2025 5:42:29 PM
伊风
2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没
90%人都会的读钟题,顶尖AI全军覆没! AI基准创建者、连续创业者Alek Safar推出了视觉基准测试ClockBench,专注于测试AI的「看懂」模拟时钟的能力。 结果让人吃惊:人类平均准确率89.1%,而参与测试的11个主流大模型最好的成绩仅13.3%。
9/8/2025 6:08:28 PM
Hinton突然对AGI乐观了!“Ilya让他看到了什么吧…”
Hinton突然对AGI变乐观了。 对于AI,他几周前还觉得是养虎为患,最新采访却改口说是一种母亲和婴儿之间的亲密共生关系。 大多数专家认为5-10年后人工智能会比人类更聪明。
9/5/2025 9:04:00 AM
Karpathy盛赞「环境中心」!AGI最后一块拼图开源,大厂豪掷百万锁死
强化学习时代,什么最重要? Karpathy给出了答案,环境! 只有环境,才能让LLM真正进行交互、执行动作、观察结果。
8/29/2025 5:09:30 PM
新智元
GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类
大家好,我是肆〇柒。 今天我们要探讨一篇由 DeepMind 联合 Stanford HAI(斯坦福以人为本人工智能研究院)共同发布的重磅实证研究报告。 这份报告首次对GPT-5的空间智能能力进行了系统性、标准化的全面评估,其结论可能会更加清晰我们对当前AI能力边界的认知。
8/21/2025 2:10:43 PM
肆零柒
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
OpenAI的AGI之路,总裁Greg Brockman在最新的访谈中说清楚了——技术层面,从文本生成转向强化学习的推理范式,在现实世界中试错并获取反馈;资源策略上,持续投入大规模计算资源;落地环节,把模型封装成Agent,将模型能力打包成为可审计的服务进程。 图片这场访谈由AI播客Latent Space主持,与Brockman探讨了OpenAI的AGI的整体技术路线与资源策略。 与此同时,OpenAI的落地布局,以及Brockman对未来的思考,也都随着访谈的进行浮出水面。
8/18/2025 5:14:41 PM
量子位
GPT-5遭用户吐槽 “垃圾”:缩放定律失效,AGI梦渐行渐远?
2025 年 8 月,OpenAI 终于推出备受期待的 GPT-5,但其表现并未如市场预期般带来 “革命性突破”,反而让 “AI 进步失速”“缩放定律失效” 的讨论再度升温。 GPT-5 实测:亮点有限,失望声四起YouTube播主 Mrwhosetheboss 的实测显示,GPT-5 并非全面领先:在创建象棋游戏时优于 . GPT-4o-mini-high,撰写视频脚本时强于 GPT-4o,且能根据任务自动匹配最优模型;但在生成 YouTube .
8/18/2025 9:57:30 AM
奥特曼爆冷改口:AGI没用?MIT预测2028年降临,50%概率
算力膨胀、模型堆叠,提示词像燃料一样被反复输入。 AI的脚步没有停下,反而越来越快。 有人预言,AGI遥遥无期,至少要等上半个世纪。
8/14/2025 6:16:24 PM
27M参数逆袭千亿大模型!小而美AI正式挑战OpenAI霸权
一个明显的趋势是,AI圈正在上演一场前所未有的"大卫战歌利亚"的逆袭好戏。 当所有人都在追逐千亿参数的庞然大物时,一个仅有27M参数的"小不点"却悄然打破了游戏规则。 昨天看到一个消息,挺震撼的。
8/5/2025 9:13:12 AM
阿丸笔记
消息称微软与 OpenAI 正进行深入谈判:确保 AGI 时代技术合作
AI在线 7 月 29 日消息,据彭博社援引两位知情人士的话报道,微软正在就一项交易进行深入谈判,该交易将确保其在未来继续获得 OpenAI 的关键技术支持。 消息人士透露,双方正在讨论新的条款,以便即使 OpenAI 宣布实现通用人工智能(AGI,即超越人类智能的人工智能),微软仍能使用其最新模型和技术。 目前,微软与 OpenAI 的现有合同中包含一项条款,一旦 OpenAI 实现 AGI,微软将失去使用该公司部分先进技术的权利。
7/29/2025 9:15:15 PM
远洋
钉钉 CTO 朱鸿:AI 已切换到下半场,垂直领域的 AGI 将很快到来
AI在线 7 月 28 日消息,钉钉今天在 2025 世界人工智能大会上举办了“AI 实干派”专场活动,其中钉钉商业总裁杨猛、钉钉 CTO 朱鸿等嘉宾均出席了此次活动。 活动中朱鸿首先指出,AI 已经从上半场切换到下半场,这是企业数据发挥出 AI 生产力价值的关键时刻。 未来几年内,垂直领域的 AGI(通用人工智能)会很快到来。
7/28/2025 6:26:07 PM
潞源(实习)
手机AGI助手还有多远?移动智能体复合长程任务测试基准与调度系统发布
本文第一作者郭源是上海交通大学计算机系三年级本科生,研究方向为自主智能体和智能体安全。 该工作由上海交通大学与澜舟科技共同完成。 论文标题:Atomic-to-Compositional Generalization for Mobile Agents with A New Benchmark and Scheduling System项目主页:: 到系统级端侧智能多模态大模型 (MLLM) 驱动的 OS 智能体在单屏动作落实(如 ScreenSpot)、短链操作任务(如 AndroidControl)上展现出突出的表现,标志着端侧任务自动化的初步成熟。
7/26/2025 6:23:00 PM
机器之心
MiniMax 创始人闫俊杰:未来 AI 会变得更普惠,AGI 必将实现
AI在线 7 月 26 日消息,据《科创板日报》报道,在 2025 世界人工智能大会主论坛上,MiniMax 的创始人兼 CEO 闫俊杰表示,未来 AI 会多家争鸣,一方面模型会有各自的特点,另一方面 AI 越来越多是 Multi-Agent,也就是多个模型和多个工具。 此外,过去一年越来越多的开源模型在产生影响力,并逼近最好的闭源模型能力。 闫俊杰提到,“未来 AI 会变得更普惠,由于模型的大小与芯片的计算速度成正比,目前训练单模型的成本几乎固定,推理成本在不断降低,未来一两年内最好模型的推理成本有望再降低一个数量级。
7/26/2025 11:54:22 AM
浩渺
消息称蚂蚁集团新设通用人工智能研究中心,一众“明星 AI 新秀”加盟
AI在线 7 月 24 日消息,雷峰网“AI 科技评论”今晚爆料称,蚂蚁集团近日新设了通用人工智能研究中心,隶属于蚂蚁技术研究院,人员包括蓝振忠、武威、吴翼、赵俊博等一众“明星 AI 新秀”,发力 AGI 基础技术研究。 今年年初,就有消息称蚂蚁将设立 AGI 研究部门,不过上半年是隶属于蚂蚁集团 CTO 线,由何征宇直接领导。 这次的调整则是由 AGI 研究转向研究院,并由蓝振忠担任中心主任,赵俊博、吴翼、武威等人向其汇报。
7/24/2025 9:31:29 PM
清源
又一华人面孔!OpenAI 深夜祭Agent大招!背后研究人员曝光!奥特曼:感受AGI!VibePPT将至,Manus晒对比测评
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)又是一个不眠夜! 7 月对于 OpenAI 而言意义非凡,从去年盛传 GPT-5 将会发布,再到近日的被挖角风波,再到 OpenAI 即将推出 AI 浏览器,各种传言全都酝酿在今天凌晨的直播里。 发布前,小编的预期是,肯定是 Agentic 办公类的产品。
7/18/2025 2:43:13 PM
马斯克又大嘴了!Grok 4 真实水平曝光,多项实测翻车,连前端都搞不定,还谈什么AGI?网友怒评:上当了,花大价钱买了个笑话!
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周,Grok 4 的发布给这个盛夏带来了一片狂热。 但太阳底下无新事,宣传往往大于实际。 在发布直播中,马斯克宣称这是“目前地表最强的 AI”,不仅全面超越了所有竞争对手,还在多个测试中打败了人类,比如所谓的 “人类终极考试”(Humanity’s Last Exam)、ARC-AGI 测试、Vending Bench 等。
7/15/2025 6:08:04 PM
云昭
资讯热榜
字节Seedream 4.0将全量开放!抢先评测来了,我们摸索出AI生图20种「邪修」玩法
OpenAI 涉足电影界,将推首部AI动画长片《Critterz》
OpenAI收购Xcode AI工具Alex团队 人才收购成科技巨头常态
万字解析!能提高10倍效率的多Agent系统:附智能海报项目实战!
不到10天,国产「香蕉」突袭!一次7图逼真还原,合成大法惊呆歪果仁
OpenAI 携手推出首部 AI 动画电影《Critterz》,2026 年全球上映
Baseten 获得 1.5 亿美元 D 轮融资,推动 AI 推理平台快速发展
报道称:OpenAI 与博通合作开发自家 AI 芯片,明年开始量产
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
蛋白质
苹果
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
生成
人形机器人
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
MCP