AI在线 AI在线

理论

光刻机巨头ASML,108亿控股了一家大模型公司

光刻机巨头ASML,也来投大模型了。 就在刚刚,荷兰半导体设备巨头ASML正式成为法国AI明星公司Mistral AI的第一大股东,一口气砸下13亿欧元(约108亿元人民币)真金白银。 这次ASML领投Mistral AI 的C轮融资总额17亿欧元(约142亿元人民币),直接把这家成立时长两年半的公司估值推高到100亿欧元(约835亿元人民币),一举成为欧洲最值钱的AI公司。
9/8/2025 3:14:10 PM

OpenAI内部大重组!模型行为团队并入Post Training,负责人另起炉灶

OpenAI又要成立新团队了! TechCrunch消息,OpenAI正在对其模型行为(Model behavior)团队进行重组。 模型行为团队,就是OpenAI内部专门塑造模型“个性”的核心研究小组。
9/8/2025 3:13:52 PM

开放全栈!超越π0,具身智能基础大模型迎来真·开源,开发者狂喜

继π0后,具身智能基座模型在中国也终于迎来了真正的开源——刚刚,WALL-OSS宣布正式开源! 在多项指标中,它还超越了π0。 如果你是搞具身的开发者,了解它的基本资料,你就一定不会想错过它:它是一个通用基础具身模型,泛化性和推理能力一流,你可以在自有本体上部署,快速微调后用起来。
9/8/2025 3:09:59 PM

上海AI Lab重磅综述:AI实现自主科学发现时代已经到来

作者丨论文团队编辑丨ScienceAI在传统印象中,科学发现是一条漫长而艰辛的道路,需要科学家投入毕生心血:检索浩如烟海的文献、设计千百次的实验、进行复杂枯燥的数据分析……如今,AI 正在实现自主科学发现,Agentic Science(Agent for Science)已经到来。 近日,上海人工智能实验室联合国内外多所顶尖高校与研究机构,发布重磅综述《A Survey on Autonomous Scientific Discovery》,系统阐述 AI 从“工具”进化为“科学发现智能体”的路径,并为 AI 实现自主科学发现和 Agentic Science 阶段构建了统一的研究框架和理论基础。 该综述背后的技术平台——Intern-Discovery(书生·科学发现平台)也已正式上线,标志着科学研究进入一个由 AI 主动驱动的新纪元。
9/8/2025 2:02:00 PM
ScienceAI

中国牢牢控制供应链 人形机器人有望主导全球

人形机器人正在向我们走来,虽然现在还踉踉跄跄,可一旦突破,将会改变整个世界。 根据摩根士丹利的报告,到2050年将有几亿个人形机器人在工业和服务领域代替人工作。 同时报告认为,在人形机器人领域,中国几乎与美国并驾齐驱。
9/8/2025 9:49:07 AM
小刀

刚刚,OpenAI发长篇论文:大模型幻觉的原因找到了!

语言模型的"幻觉"问题一直是人工智能领域的热门话题。  近日,OpenAI研究团队发表了一篇重磅论文《Why Language Models Hallucinate》(为什么语言模型会产生幻觉),从统计学角度深入剖析了语言模型产生幻觉的根本原因。 本文将为你详解这篇论文的核心观点和技术细节。
9/8/2025 9:43:02 AM
一度

奥特曼一席话,剑桥小哥当场撕毁合约转AI!附00后44万AI岗面经

搞音乐不如搞AI!  剑桥英伦音乐才子,撕毁唱片合约,押注AI革命。  95后音乐才俊Alexander Cobb本要开启人生巅峰——与唱片公司签约、音乐作品播放量破万,一脚踏入娱乐圈,从此星途坦荡。
9/8/2025 9:16:00 AM

陶哲轩都惊了!o3首战「AI奥数」碾压夺冠,开源军团仅差5分狂追OpenAI

「AI奥数」第二届大赛,英伟达团队(NemoSkills)曾夺下第一! 这一次,AIMO2组委会再次重启赛题,OpenAI o3首次参赛,就拿下了最亮眼的成绩。 陶哲轩激动表示,过去,这个比赛仅限于开源模型,计算资源也卡得比较紧。
9/8/2025 9:15:00 AM

苹果端侧AI两连发!模型体积减半、首字延迟降85倍,iPhone离线秒用

就在刚刚,苹果在Hugging Face上重磅开闸:这一次不是零碎更新,而是FastVLM与MobileCLIP2两条多模态主线集中亮相。 一个主打「快」,把首字延迟压到竞品的1/85;另一个突出「轻」,在保持与SigLIP相当精度的同时,体积减半。 打开摄像头实时字幕、离线识别翻译、相册语义搜索,这些场景都能体验。
9/8/2025 9:14:00 AM

幸好图灵不是一位好棋手

咱就是说,还好祖师爷图灵不是一位国际象棋大师! 不然整个世界的AI发展脉络以及技术进展速度,可能和现在完全不一样……看到这儿有的人可能犯嘀咕:不是,为啥这么说啊? ?
9/8/2025 9:04:00 AM

大模型破译甲骨文创下新SOTA!复旦团队推出新框架

让大模型破译从未见过的甲骨文,准确率拿下新SOTA! 来自复旦大学的研究人员提出了一种基于部首和象形分析的可解释甲骨文破译框架——不仅在公开基准数据集HUST-OBC和EV-OBC上,达到最先进的Top-10识别准确率以及优异的零样本破译能力。 而且面对未破译甲骨文,所提方法也能够输出可解释性的分析文本,从而为考古破译工作提供潜在帮助。
9/8/2025 9:02:00 AM

你的 AI “体检”了吗?开源 AI 红队测试平台,一键自查三大风险

作者 | 腾讯朱雀实验室最近的AI圈,简直比好莱坞大片还精彩。 一边是各家的顶尖模型接连发布,技术狂欢席卷全球;另一边,这些看似无所不能的“最强大脑”却集体被成功“越狱”(Jailbreak)输出有害内容。 [大模型们的越狱“一日游”]而当我们回过头看,每个重磅发布的大模型都在经历类似的迅速失守,从23年的DAN(Do Anything Now)、24年的BoN(Best of N)到今年的回音室(Echo Chamber)与模型降级(PROMISQROUTE)攻击,各种新的通用越狱手法层出不穷,而在arXiv上截止到今年7月累计已有七百余篇越狱攻击相关论文。
9/8/2025 9:00:00 AM
腾讯程序员

震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?

一直以来,预训练,都是大模型训练过程中最花钱的部分。 比如,在DeepSeek V3中,它的成本占比就超过95%。 谁能在这里节省算力,就等于赚了。
9/8/2025 8:59:00 AM

设计师大解放!清华发布「建筑平面图」自动生成模型 | ACL'25

建筑平面图是AEC(建筑、工程、施工)领域的核心 「语言」,贯穿设计思想草绘、方案交流与落地执行全流程。 而住宅作为人们日常生活的基本空间载体,其平面图更是在建筑设计早期发挥着核心作用。 然而,传统平面图设计流程高度依赖建筑师个人经验,存在效率低、反馈慢、缺乏智能辅助等问题。
9/8/2025 8:54:00 AM

谁不用谁亏!Karpathy吹爆GPT-5:10分钟编码完胜Claude一小时,奥特曼秒回感谢

GPT-5 Pro再次得到了AI大佬的认可。 今天,Karpathy一早激动发文,「必须再吹一波OpenAI的GPT-5 Pro,真的太强了」! 这究竟是肿么回事儿?
9/8/2025 8:53:00 AM

调整训练数据出场顺序,大模型就能变聪明!无需扩大模型/数据规模

模型训练重点在于数据的数量与质量? 其实还有一个关键因素——数据的出场顺序。 对此,微软亚洲研究院提出了一种全新的文本数据组织范式DELT(Data Efficacy in LM Training),通过引入数据排序策略,充分挖掘训练数据潜力,在不同模型尺寸与规模下都达到了良好性能。
9/8/2025 8:50:00 AM

字节发了个机器人全能大模型,带队人李航

机器人终于不用散装大脑了! 字节Seed一个模型就能搞定机器人推理、任务规划和自然语言交互。 经常做机器人的朋友都知道,以前想让机器人干活,得先解决一个烦人的问题——模块之间的信息代沟。
9/8/2025 8:45:00 AM

拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此

总参数达到1万亿,阿里迄今为止最大的模型来了! 没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。 1万亿啥概念?
9/8/2025 8:40:00 AM