AI在线 AI在线

理论

Bengio亲手戳穿CoT神话!LLM推理是假象,25%顶会论文遭打脸

图灵奖大牛Bengio新作上线了! 这篇由牛津、谷歌DeepMind、Mila多家机构联手论文指出——思维链并非可解释性。 这一观点彻底打破了许多人的认知:CoT看似一步步给出答案,实则并不一定是其真实的推理过程。
7/3/2025 1:45:00 AM
新智元

李飞飞最新访谈:没有空间智能,AGI就不完整

这是“AI教母”李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。 不过她有自己的表述,从进入人工智能领域开始,她就确定了她终身奋斗的梦想:让智能体能够讲述世界的故事。 而这,离不开空间智能。
7/2/2025 6:15:02 PM

Grok4未上线源码先泄露!马斯克的Code模型被实锤!将深度对齐开发者编程习惯,能否逆袭前代硬伤?再获融资百亿,算力多到用不完

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Grok 4真的要来了! 马斯克预告多次的Grok 3.5跳票,直接给大家端上4.0的更强版本。 为了这一次发布能够给AI圈一点震撼,Grok团队也是真的够拼,又一次把帐篷搭进了办公室。
7/2/2025 4:53:28 PM
伊风

Grok 4源代码刚刚泄露!上线倒计时,马斯克xAI估值破1130亿,大模型要变天

突发消息:Grok 4即将上线! 与此同时,xAI再度获得百亿美元融资,估值已经直冲1130亿。 马斯克的AI帝国,再度以可怕的规模扩张。
7/2/2025 2:42:03 PM

9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA | 智谱开源

如果一个视觉语言模型(VLM)只会“看”,那真的是已经不够看的了。 因为现在真实世界的任务简直不要太复杂,要想让AI干点实事儿,光有多模态还不够,必须还得有深度思考的强推理能力。 而就在刚刚,智谱发布并开源了一个仅9B大小的模型——GLM-4.1V-9B-Thinking,在28项评测中一举拿下23个SOTA!
7/2/2025 2:39:29 PM

Prompt格局小了,上下文工程称王!Shopify CEO提上下文工程,大神Karpathy一众创业者狂喊+1,网友:都是巫术

编辑 | 云昭Prompt工程又“失效”了? ! 之前是各种白领对它“喊打喊杀”,担心它取代自己的工作,后来的口风就变成了“大模型强大到不再需要Prompt工程了”,现在圈里又有谷歌的大佬抛出了神断言,让评论区炸锅的那种。
7/2/2025 12:10:50 PM
云昭

小扎狂砸3亿美金薪酬包!奥特曼放狠话:传教士终将打败雇佣兵

「传教士将打败雇佣兵」! 在小扎挖走近十位OpenAI研究院后,奥特曼在内部备忘录中,写下了这句提振士气的话。 这张在全网疯传的图片中,OpenAI多数大神纷纷加入Meta,华人研究员更是占据了半壁江山。
7/2/2025 9:56:09 AM

震惊!OpenAI创始人透露:这是人类历史上创业最好的时代,但99%的人都理解错了

Hi,大家好,我叫秋水,当前专注于 AI Agent(智能体)。 你有没有想过,为什么有些人能在短短几年内从默默无闻变成改变世界的人? 近期,我看到了OpenAI的创始人Sam Altman的访谈,这个34岁就创造出ChatGPT、估值千亿美元公司的男人,说了一句让所有人震惊的话:"这是人类历史上,创业最好的时代!
7/2/2025 9:56:06 AM
秋水

开源端到端语音大模型:直接从原始音频输入,生成语音输出

目前,大模型LLMs能胜任知识问答、代码辅助等多种任务,但传统模型大多只能输出文本,无法直接生成自然语音,这让人机音频交互不够顺畅。 要知道,人类交流和感知环境可不只是靠文字,语音里藏着音色、情感、语调等丰富信息,其他音频也包含着现实场景的关键信息。 所以,能根据语音或音频输入直接回应的音频语言模型就很重要,也是迈向AGI的关键一步。
7/2/2025 9:46:30 AM

比10年专业医生准4倍!微软发布突破性医疗AI系统

微软首席执行官Satya Nadella在社交平台分享了,微软最新发布的突破性医疗AI系统MAI-DxO。 MAI-DxO最大技术创新在于其模型无关的设计,使其能够适配不同厂商、不同能力的语言模型,并普遍提升它们的诊断性能。 并且能模拟真实医生的诊断流程,比专业医生的准确率更高。
7/2/2025 9:43:13 AM

亚马逊宣布全球已部署100万台机器人 新AI模型助力物流效率提升

据外媒报道,亚马逊近日宣布其全球机器人部署数量已达 100 万台,标志着该公司在自动化与人工智能领域实现重大突破。 与此同时,亚马逊推出名为 DeepFleet 的生成式 AI 基础模型,将进一步提升物流网络运行效率。 资料显示,作为全球最大的移动机器人制造商和运营商,亚马逊自2012 年起持续推进机器人化进程,目前已在全球 300 多个设施中部署机器人系统。
7/2/2025 9:37:02 AM

深度解析 MEM1:开启智能体长时序高效交互之门

大家好,我是肆〇柒。 相信大家在落地AI应用的时候,对长上下文的处理时所遇到的挑战,都深有感触。 大型语言模型(LLM)于单轮任务中表现卓越,然而现实应用场景日益复杂,多轮交互需求剧增。
7/2/2025 9:33:54 AM
肆零柒

Cursor也挖人了:Claude Code开发主管和产品经理被一锅端

编程神器Cursor的母公司Anysphere也开始挖人了Cursor这次挖到了合作伙伴Anthropic的两名前核心高管:原“Claude Code”项目开发负责人Boris Cherny将出任首席架构师兼工程主管,原项目产品经理Cat Wu将担任产品负责人Boris Cherny 2024年9月加入Anthropic,入职还不到一年,之前在小扎公司Meta 干了六年多,任职首席软件工程师, Instagram 的服务器架构和开发基础设施主管, Meta 的代码质量主管,毕业于美国加州大学圣迭戈分校,学的是经济学Cat Wu全名Catherine Wu,2024年8月加入Anthropic,擅长构建高可靠、可解释、可控制的人工智能系统,本科毕业于普林斯顿大学,专业计算机科学,加入Anthropic之前有多段不同领域工作实习经历,最长两年,比如在谷歌实习任职软件工程师,在J.P. 摩根实习任职交易员,在Alexandr Wang公司scale AI作为作为产品经理任职两年此番“挖角”或将使两家公司的合作关系变得微妙——毕竟Cursor的大部分AI功能都由Anthropic提供技术支持。 目前,Anthropic的年化收入已高达40亿美元,而Cursor的年度经常性收入也已突破5亿美元AI编程领域现在竞争非常激烈,下面给大家梳理一下,如今,AI编程领域的战火已蔓延至四大战场:1.
7/2/2025 9:29:34 AM

不用AI编程就滚蛋!这家公司CEO一封邮件把程序员都惹毛了

想象一下,你的老板突然在全员邮件里宣布:从下个月开始,公司每月投入5万美元购买AI编程工具,所有不使用"Vibe Coding"的程序员都要接受绩效改进。 这不是假设。 这是一家真实公司的CEO刚刚发出的邮件内容。
7/2/2025 9:25:01 AM
阿丸笔记

ICML 2025 Spotlight | 清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式,刷新图像生成SOTA

文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。 该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。
7/2/2025 9:21:30 AM

大模型时代,通用视觉模型将何去何从?

过去几年,通用视觉模型(Vision Generalist Model,简称 VGM)曾是计算机视觉领域的研究热点。 它们试图构建统一的架构,能够处理图像、点云、视频等多种视觉模态输入,以及分类、检测、分割等多样的下游任务,向着「视觉模型大一统」的目标迈进。 然而,随着大语言模型 LLM 的迅猛发展,研究热点已经悄然发生转移。
7/2/2025 9:17:13 AM

Meta“1亿美元年薪”震荡硅谷!奥特曼回应:总有人唯利是图,而且都算不上TOP

疯狂,太疯狂。 这两天,硅谷乃至全球AI领域的注意力都被Meta老板扎克伯克带走了,毕竟也不是谁都能boss直聘,一举挖走8名OpenAI核心员工。 更何况其中大部分,还是以聪明能干吃苦耐劳著称的华人研究员。
7/2/2025 9:13:56 AM

华为又开源了个大的:超大规模MoE推理秘籍

超大规模MoE模型(如DeepSeek),到底该怎么推理才能做到又快又稳。 现在,这个问题似乎已经有了标准答案——华为一个新项目,直接把推理超大规模MoE背后的架构、技术和代码,统统给开源了! 这个新开源项目名叫Omni-Infer,整体来看,它对于企业用户来说是非常利好的。
7/2/2025 8:55:00 AM