AI在线 AI在线

理论

华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断

大模型的落地能力,核心在于性能的稳定输出,而性能稳定的底层支撑,是强大的算力集群。 其中,构建万卡级算力集群,已成为全球公认的顶尖技术挑战。 但是,在华为,昇腾万卡算力集群,已经可以做到近乎“永不罢工”了:训练可用度达98%:这就好比你开着一辆车,全年365天里,有358天无论刮风下雨都能一脚油门就出发,从不掉链子,有问题可以随时检修,几乎不会耽误你的任何行程。
6/10/2025 4:36:29 PM

Ilya回归,获授「第四学位」!AI将完成人类能做的一切,毕业演讲实录

近日,消失了半年的Ilya突然现身多伦多大学,接受母校授予他的荣誉理学博士学位。 现场演讲亮点如下:AI将能够完成我们能做的所有事情,不仅仅是其中的一部分,而是全部。 大脑是一个生物计算机,而AI是数字计算机、一个数字大脑。
6/10/2025 4:29:25 PM
新智元

刚刚,2025哥德尔奖出炉!破解30年难题,十年论文摘桂冠

就在刚刚,理论计算机科学界迎来喜讯! 康奈尔大学副教授Eshan Chattopadhyay与导师David Zuckerman,荣获2025年哥德尔奖! 凭借2016年合著的论文《Explicit Two-Source Extractors and Resilient Functions》,他们共享此奖。
6/10/2025 4:27:16 PM

OpenAI年化收入突破100亿美元 过去一年亏损约50亿美元

在人工智能领域,OpenAI无疑是一颗耀眼的明星。 自2022年底推出ChatGPT聊天机器人以来,短短不到三年时间,其年经常性收入(annual recurring revenue, ARR)便实现了惊人的飞跃,达到了100亿美元。 据OpenAI方面透露,这100亿美元的年经常性收入涵盖了公司消费者产品、ChatGPT企业产品以及应用程序接口(API)的销售所得。
6/10/2025 4:24:59 PM
小菲

任正非最新访谈谈人工智能:也许是人类社会最后一次技术革命

近日在深圳华为总部,人民日报记者一行与华为首席执行官任正非面对面交流。 交流中任正非在回答有关人工智能的提问时表示,人工智能也许是人类社会最后一次技术革命,其发展要经历数十年、数百年,中国有很多优势。 谈及中国发展人工智能的优势时,任正非称,人工智能在技术上的要害,是要有充足的电力、发达的信息网络。
6/10/2025 4:21:00 PM

“程序员炸锅”!Claude一夜撤离 Windsurf,OpenAI 收购遭"精准狙击"

本月初,Anthropic 悄然切断 Claude 3.x 模型在 Windsurf 平台上的接入,直接影响其免费与 Pro 试用用户。 Windsurf的官方消息事情发生得很快。 6 月 4 日,Windsurf 收到 Anthropic 的正式通知:Claude 3.x 系列模型将在不到一周后全面停止服务。
6/10/2025 4:19:54 PM

我让十个大模型又参加了完整版数学高考,第一名居然是它......

昨天,我不是发了几个大模型参加数学高考的测试文章嘛。 没想到热度挺高,大家还挺关注的。 图片不过,很多评论区的小伙伴也说,根本看不出来区别。
6/10/2025 11:25:31 AM
数字生命卡兹克

60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了

让推理模型针对风险指令生成了安全输出,表象下藏着认知危机:即使生成合规答案,超60%的案例中模型并未真正理解风险。 换句话说,主流推理模型的安全性能存在系统性漏洞。 针对此种现象,淘天集团算法技术-未来实验室团队引入「表面安全对齐」(Superficial Safety Alignment, SSA)这一术语来描述这种系统性漏洞。
6/10/2025 11:25:06 AM

斯坦福NYU联合研究:AI和人类思维差异的惊人发现 —— 为什么大模型"聪明"却不够"智慧"?

1、一个令人深思的认知谜题想象一下这样的场景:你和ChatGPT都被要求对一堆动物进行分类。 你可能会说"鸟类里,知更鸟是典型代表,而企鹅有点特殊",而AI却可能简单粗暴地把所有有翅膀的都归为一类。 表面上看,你们的分类结果差不多,但背后的思维逻辑却天差地别。
6/10/2025 11:22:38 AM
无影寺

强化学习之父:LLM主导只是暂时,扩展计算才是正解

这是新晋图灵奖得主、强化学习之父Richard Sutton对未来的最新预测。 就在刚刚的新加坡国立大学建校120周年(NUS120)之际,Sutton受邀发表演讲——塑造AI和强化学习的未来。 其实,这已经不是Sutton第一次在公开场合表达类似的观点,早在他19年的著作《痛苦的教训》中,他就明确提出:让AI尤其是LLM模仿人类思维方式,只能带来短期的性能提升,长期看只会阻碍研究的持续进步。
6/10/2025 11:22:09 AM

开源多智能体开发框架:支持MCP、Agent SDK,超2000颗星

著名企业孵化器Y Combinator支持的开源多智能体开发框架Rowboat。 Rowboat支持火热的MCP服务以及OpenAI开源的Agent SDK,几分钟就能开发一个复杂的智能体工作流。 开源地址:、Playground、Copilot三大块组成:Agent,主要负责处理对话的特定部分,并能依据指令使用工具执行任务。
6/10/2025 9:28:31 AM

苹果炮轰AI推理遭打脸,GitHub大佬神怒怼!复杂任务≠推理能力

最近,苹果公司发表了预印本论文,指出推理大模型存在重大缺陷。 昨天,Ruben Hassid发布了相关解读的X帖子,认为这是项突破性研究:苹果证明了Claude等AI推理模型,根本不会思考。 这种解读在社交平台上广泛传播,浏览量已超过1000万,且仍在持续增长。
6/10/2025 9:25:27 AM

数学圈地震!o3靠直觉刷爆人类顶尖难题,14位专家集体破防

推理模型不会推理,一夜成为硅谷最热门的话题。 来自Epoch AI最新报告称,o3-mini-high不仅会推理,还能破解顶尖数学难题。 14位数学家组团,共同评估o3在29道FrontierMath推理能力。
6/10/2025 9:22:31 AM

比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临

王劲,香港大学计算机系二年级博士生,导师为罗平老师。 研究兴趣包括多模态大模型训练与评测、伪造检测等,有多项工作发表于 ICML、CVPR、ICCV、ECCV 等国际学术会议。 近年来,大型语言模型(LLMs)在多模态任务中取得了显著进展,在人工通用智能(AGI)的两大核心支柱(即理解与生成)方面展现出强大潜力。
6/10/2025 9:18:53 AM

刚刚,苹果WWDC掀AI重构风暴!端侧模型全开放、AI版Siri却成最大「鸽」王

今年的苹果,到底有没有新活? 北京时间今天凌晨 1 点,一年一度的「科技圈春晚」—— 苹果全球开发者大会 WWDC 在 CEO 蒂姆・库克的演讲中拉开了序幕! 此次大会,苹果宣布了一系列操作系统、服务和软件的更新,其中包括全新的系统命名规则以及名为液态玻璃( Liquid Glass)的新设计语言。
6/10/2025 9:10:47 AM

AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板

用AI来整理会议内容,已经是人类的常规操作。 不过,你猜怎么着? 面对1000道多步骤音频推理题时,30款AI模型竟然几乎全军覆没,很多开源模型表现甚至接近瞎猜。
6/10/2025 9:10:00 AM

AI七个月突破数学家“围剿”反超人类!14位数学家深挖原始推理token:不靠死记硬背靠直觉

从只能答对2%的题目,到在超难数学题集中刷下22%得分,甚至超过人类团队平均水平,大模型需要多长时间? 现在,令数学家们都惊讶的结果已经尘埃落定:7个月。 发生在大名鼎鼎的“专为为难大模型而生的”FrontierMath基准测试上的这一幕,在激起热议同时,也引发了新的思考:大模型们是怎么做到的?
6/10/2025 9:09:00 AM

双重突破:全球首个零售VLA大模型来了!开源OpenWBT让机器人遥操门槛暴降!

学会“适当暂停与总结”,大模型终于实现无限推理。 想象一下,让你一口气不歇地推演一个超复杂数学证明,大脑也会“内存溢出”吧? 如今的大模型在长上下文推理中也面临同样的困境,随着推理长度增加而指数级增长的计算成本,以及由于长度受限而被迫中断推理过程。
6/10/2025 9:07:00 AM