AI在线 AI在线

理论

通义DeepResearch开源发布:首个匹敌OpenAI的全栈Web Agent

大家好,我是肆〇柒。 在AI飞速发展的今天,AI Agent正经历从简单对话机器人向自主智能体的重大转变。 就在上周,通义实验室(Tongyi Lab)开源了最新的研究成果——通义DeepResearch,并随开源发布了六篇论文,被社区戏称为“腹泻式发论文”。
9/25/2025 10:25:29 AM
肆零柒

刚刚,GPT-5首次通过「哥德尔测试」!破解三大数学猜想

AI迎来历史性一刻! GPT-5成功破解三大猜想,通过了「哥德尔测试」。 图片OpenAI科学家Sebastien Bubeck惊叹地表示,这类开放性问题,顶尖博士生往往耗费数日才能解决。
9/25/2025 10:01:33 AM
新智元

LeCun团队开源首个代码世界模型:能生成代码还能自测自修!传统编程模型一夜成古典

刚刚,Meta FAIR推出了代码世界模型! CWM(Code World Model),一个参数量为32B、上下文大小达131k token的密集语言模型,专为代码生成和推理打造的研究模型这是全球首个将世界模型系统性引入代码生成的语言模型。 图片与现有代码大模型相比,CWM最与众不同的一点在于,它不仅能生成代码、理解语义。
9/25/2025 9:33:54 AM

阿里万亿参数大模型震撼发布!Qwen3-Max编程能力超越GPT-5

你有没有想过,什么时候国产AI能在编程领域真正"扳倒"GPT-5? 昨天阿里云栖大会上,这个问题有了答案。 通义千问Qwen3-Max正式发布,直接放出了一个让硅谷都震惊的成绩单:万亿参数规模,编程能力测试全球第一。
9/25/2025 9:09:22 AM
阿丸笔记

CrowdStrike联手Meta发布AI安全基准,让AI在真实网络攻击中证明自己

美国网络安全巨头CrowdStrike和Meta凑到一块,在拉斯维加斯的Fal.Con 2025大会上宣布,联合推出了一个叫CyberSOCEval的开源基准测试套件。 这东西干嘛的? 就是一张给所有号称能做网络安全的AI大语言模型准备的考卷,专门考它们在真实的安全运营中心(SOC)环境下,到底能不能打。
9/25/2025 9:04:00 AM

震撼!AI物理「双修」:亥姆霍兹方程嵌进生成器,伪影当场消失

传统AI在构建无线电地图时常因缺乏物理规律的约束而导致预测失真。 为解决这一难题,香港科技大学(广州)的研究团队创新性地提出了PhyRMDM框架,首次将物理信息神经网络(PINN)与扩散模型(Diffusion Model)相结合,并设计了全新的双Unet架构。 该框架通过物理方程引导AI模型的训练过程,实现了数据驱动与物理规律的完美融合,将无线电地图的生成精度与物理一致性提升到新的高度。
9/25/2025 9:03:00 AM

Meta打开AI元认知,让AI不止会解题,还会总结套路了

大语言模型记性不太好。 具体来说,它们在解决需要多个步骤的复杂问题时,经常“顾尾不顾头”。 比如它刚辛辛苦苦推导出一个几何级数求和公式解了一道题,下一道题遇到类似的问题,它就把刚才的功夫忘得一干二净,又从头开始重新推导一遍。
9/25/2025 9:02:00 AM

苏黎世联邦理工学院:Prompt 的尽头是 MBTI !

怎样写提示词(Prompt)? 苏黎世联邦理工学院(ETH Zurich)与BASF研究人员联合发布的新研究给出了答案:提示词的尽头,不是工具箱,而是性格表。 图片他们提出了一个名为 MBTI-in-Thoughts 的框架,用心理学中的MBTI人格模型提示大语言模型,从而在不改变模型参数的情况下,引导其产生稳定、可预测的人格行为倾向。
9/24/2025 6:06:33 PM

斯坦福用 AI 造出能杀菌的病毒:首次完整生成病毒基因组

斯坦福大学与Arc研究所的科学家宣布,他们利用人工智能成功设计出能够杀死细菌的病毒。 研究团队在最新的预印本论文中写道,这是首次通过生成式方法设计出完整病毒基因组,也是AI迈向“设计生命体”的开端。 图片他们使用一套名为Evo的AI系统,它的运作方式与大型语言模型类似,只不过不是学习文字,而是学习生物基因。
9/24/2025 6:02:55 PM

吴泳铭不藏了!大模型时代,阿里要做这两件大事:AI时代的安卓,全球超级AI云!

编辑 | 云昭“我们判断,大模型将是下一代OS;通义要做AI时代的安卓系统! ”“未来全球可能只会有5~6家超级AI云计算平台。 ”9月24日,云栖大会如期而至。
9/24/2025 3:43:22 PM
云昭

万亿级AI难题:Snowflake、Tableau与BlackRock为何公开其数据核心机密

Snowflake、Salesforce、dbt Labs以及另外十几家科技公司于周二宣布,将共同制定一项通用标准,用于定义企业数据并实现跨平台共享,以此解决企业高管口中AI面临的最根本瓶颈问题。 开放语义交换(Open Semantic Interchange,简称OSI)计划集结了原本竞争激烈的企业,这些企业一致认为,企业系统间数据定义不一致阻碍了AI的规模化应用。 该计划得到了贝莱德(BlackRock)的支持,Alation、Atlan、Blue Yonder、Cube、Hex、Honeydew、Mistral AI、Omni、RelationalAI、Select Star、Sigma和ThoughtSpot等公司也参与其中。
9/24/2025 2:53:04 PM
Michael

AIME'25满分炸场!Qwen一波七连发,全家桶大更新

它来了,它来了! 新一代旗舰模型Qwen3-Max带着满分成绩,正式地来了——国产大模型首次在AIME25和HMMT这两个数学评测榜单拿下100分! 和前不久Qwen3-Max-Preview一致,参数量依旧是超万亿的规模。
9/24/2025 2:50:58 PM

AI助力提升生产效率与营收能力的实战案例

如果一天以头痛开场,那通常意味着有人要我为自己的支出辩护。 别误会,不是我的配偶,而是我们的CEO,他总会问我,我的预算创造了多少收入或节省了多少成本。 另一个让我头疼的情况是,我总是忙于四处救火——而不是让其他人去处理(最好是没有火情!)——导致我无法开展真正想做的项目。
9/24/2025 2:02:54 PM
Meadows

一年4次迭代,狂堆GPU成真!微软AI冷液灌芯,散热暴涨3倍

大家一直在担心:AI越来越烧钱,ChatGPT的订阅费会不会年年涨? 更让人头疼的,是用AI时越来越容易卡顿、掉链子。 罪魁祸首,其实是芯片过热。
9/24/2025 1:07:28 PM

Nano Banana不及格,开源模型一分难求!上海AI Lab新基准直击文生图模型痛点

从GPT-4o到Nano Banana、Seedream 4.0,今年的大模型想要出圈,“画得好”俨然成了必杀技。 不过,在比拼真实感、艺术性方面,生图模型是神仙打架,在“做题”上,现如今的模型们又到底能力几何? 比如,当指令变成画出1-甲基环己烯酸催化水合的反应机理、根据给定的边集画出图的最小生成树,模型能否像相关专业的人类考生一样,真正把知识理解、推理和作图结合在一起?
9/24/2025 1:04:01 PM

阿里吴泳铭:AGI只是起点,超级人工智能ASI才是终极目标

9月24日,在杭州召开的云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表主旨演讲,他认为实现通用人工智能AGI已是确定性事件,但这只是起点,终极目标是发展出能自我迭代、全面超越人类的超级人工智能ASI。 吴泳铭首次系统阐述了通往ASI的三阶段演进路线:第一阶段:“智能涌现”,AI通过学习海量人类知识具备泛化智能。 第二阶段:“自主行动”,AI掌握工具使用和编程能力以“辅助人”,这是行业当前所处的阶段。
9/24/2025 11:26:14 AM

机器人界的「Imagenet 时刻」,李飞飞团队官宣全球顶级具身智能挑战赛

在计算机视觉的历史上,Imagenet 挑战赛曾被誉为 AI 发展的分水岭,引爆了深度学习的浪潮。 那么,在具身智能与机器人领域,是否也会迎来类似的 “拐点时刻”? 李飞飞团队与斯坦福 AI 实验室正式官宣:首届 BEHAVIOR 挑战赛将登陆 NeurIPS 2025。
9/24/2025 11:24:42 AM

刚刚,Sam Altman发文,透露OpenAI正在干的大事业

OpenAI 最近发出的关键信号,无疑是两个字:算力。 就在昨天,英伟达官宣向 OpenAI 投资 1000 亿美元,用至少 400 万 GPU 打造超级 AI 巨兽。 热乎劲还没过,刚刚 OpenAI 大手一挥:我们还要一口气建设 5 个算力中心!
9/24/2025 11:20:29 AM