AI在线 AI在线

理论

维度的囚笼:Embedding 检索模型无法逾越的数学边界

大家好,我是肆〇柒。 今天要和大家分享一篇由Google DeepMind与约翰霍普金斯大学联合研究的重要论文《On the Theoretical Limitations of Embedding-Based Retrieval》。 这项研究揭示了一个令人震惊的事实:即使是"谁喜欢考拉袋鼠?
9/9/2025 9:15:12 AM
肆零柒

员工无意识地使用AI:企业最大的风险隐患

在评估AI风险时,企业往往聚焦于最复杂的威胁:算法偏见、知识产权问题或新兴监管,但增长最快、却最容易被忽视的风险要简单得多——员工可能根本没有意识到自己正在使用AI。 AI早已不再局限于企业创新实验室或数据科学团队,而是通过Microsoft Copilot、Google Gemini、邮件摘要工具、CRM聊天机器人以及招聘平台等深度嵌入日常工作流程。 许多员工每天都在使用AI,却往往毫不自知。
9/9/2025 7:15:00 AM
Arti

生产级AI智能体架构指南:从Demo惊艳到落地可靠

在AI领域,单提示词演示(Single-prompt demos)总是令人眼前一亮,但真正的生产落地却充满挑战。 坦白而言,即便最出色的大型语言模型(LLM)能在演示中大放异彩,现实世界对AI系统的要求远比这更高——用户需要足以支撑业务决策的精准结果,管理者要求清晰可追溯的审计记录,运维团队则需要能有效控制成本与延迟的调节手段。 问题的核心在于那种“大包大揽”的单提示词模式:它就像一个黑箱,将规划、执行与质量控制揉合成一团模糊的整体,不仅脆弱易故障、难以审计,更无法突破概念验证(PoC)阶段实现规模化应用。
9/9/2025 2:11:00 AM
大模型之路

2025年,你不能错过Spring AI,那个汲取了LangChain灵感的家伙!

如何给Spring AI下定义呢? 在我看来,Spring AI和AI的关系,就像Spring Boot和Spring的关系一样,旨在简化包含AI功能的应用程序开发,避免不必要的复杂性。 据说,Spring AI是从著名的Python LangChain中汲取的灵感,就是为了让生成式AI应用不仅仅面向Python开发者,使Java这个伟大的语言再次伟大!
9/9/2025 1:10:00 AM
小托尼学长

从「会说」迈向「会做」,LLM下半场:Agentic强化学习范式综述

本文第一作者为新加坡国立大学博士生 张桂彬、牛津大学研究员 耿鹤嘉、帝国理工学院博士生 于晓航;通讯作者为上海人工智能实验室青年领军科学家 白磊 和 牛津大学博士后 / 上海人工智能实验室星启研究员 尹榛菲过去几年,大语言模型(LLM)的训练大多依赖于基于人类或数据偏好的强化学习(Preference-based Reinforcement Fine-tuning, PBRFT):输入提示、输出文本、获得一个偏好分数。 这一范式催生了 GPT-4、Llama-3 等成功的早期大模型,但局限也日益明显:缺乏长期规划、环境交互与持续学习能力。 为了突破这样的瓶颈,自 2025 年初 DeepSeek R1 及其背后的 GRPO 范式获得空前热度以后,一种新的训练范式 ——Agentic Reinforcement Learning(Agentic RL),愈发到社区关注。
9/8/2025 7:25:00 PM
机器之心

2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没

90%人都会的读钟题,顶尖AI全军覆没! AI基准创建者、连续创业者Alek Safar推出了视觉基准测试ClockBench,专注于测试AI的「看懂」模拟时钟的能力。 结果让人吃惊:人类平均准确率89.1%,而参与测试的11个主流大模型最好的成绩仅13.3%。
9/8/2025 6:08:28 PM

光刻机巨头ASML,108亿控股了一家大模型公司

光刻机巨头ASML,也来投大模型了。 就在刚刚,荷兰半导体设备巨头ASML正式成为法国AI明星公司Mistral AI的第一大股东,一口气砸下13亿欧元(约108亿元人民币)真金白银。 这次ASML领投Mistral AI 的C轮融资总额17亿欧元(约142亿元人民币),直接把这家成立时长两年半的公司估值推高到100亿欧元(约835亿元人民币),一举成为欧洲最值钱的AI公司。
9/8/2025 3:14:10 PM

OpenAI内部大重组!模型行为团队并入Post Training,负责人另起炉灶

OpenAI又要成立新团队了! TechCrunch消息,OpenAI正在对其模型行为(Model behavior)团队进行重组。 模型行为团队,就是OpenAI内部专门塑造模型“个性”的核心研究小组。
9/8/2025 3:13:52 PM

开放全栈!超越π0,具身智能基础大模型迎来真·开源,开发者狂喜

继π0后,具身智能基座模型在中国也终于迎来了真正的开源——刚刚,WALL-OSS宣布正式开源! 在多项指标中,它还超越了π0。 如果你是搞具身的开发者,了解它的基本资料,你就一定不会想错过它:它是一个通用基础具身模型,泛化性和推理能力一流,你可以在自有本体上部署,快速微调后用起来。
9/8/2025 3:09:59 PM

上海AI Lab重磅综述:AI实现自主科学发现时代已经到来

作者丨论文团队编辑丨ScienceAI在传统印象中,科学发现是一条漫长而艰辛的道路,需要科学家投入毕生心血:检索浩如烟海的文献、设计千百次的实验、进行复杂枯燥的数据分析……如今,AI 正在实现自主科学发现,Agentic Science(Agent for Science)已经到来。 近日,上海人工智能实验室联合国内外多所顶尖高校与研究机构,发布重磅综述《A Survey on Autonomous Scientific Discovery》,系统阐述 AI 从“工具”进化为“科学发现智能体”的路径,并为 AI 实现自主科学发现和 Agentic Science 阶段构建了统一的研究框架和理论基础。 该综述背后的技术平台——Intern-Discovery(书生·科学发现平台)也已正式上线,标志着科学研究进入一个由 AI 主动驱动的新纪元。
9/8/2025 2:02:00 PM
ScienceAI

中国牢牢控制供应链 人形机器人有望主导全球

人形机器人正在向我们走来,虽然现在还踉踉跄跄,可一旦突破,将会改变整个世界。 根据摩根士丹利的报告,到2050年将有几亿个人形机器人在工业和服务领域代替人工作。 同时报告认为,在人形机器人领域,中国几乎与美国并驾齐驱。
9/8/2025 9:49:07 AM
小刀

刚刚,OpenAI发长篇论文:大模型幻觉的原因找到了!

语言模型的"幻觉"问题一直是人工智能领域的热门话题。  近日,OpenAI研究团队发表了一篇重磅论文《Why Language Models Hallucinate》(为什么语言模型会产生幻觉),从统计学角度深入剖析了语言模型产生幻觉的根本原因。 本文将为你详解这篇论文的核心观点和技术细节。
9/8/2025 9:43:02 AM
一度

奥特曼一席话,剑桥小哥当场撕毁合约转AI!附00后44万AI岗面经

搞音乐不如搞AI!  剑桥英伦音乐才子,撕毁唱片合约,押注AI革命。  95后音乐才俊Alexander Cobb本要开启人生巅峰——与唱片公司签约、音乐作品播放量破万,一脚踏入娱乐圈,从此星途坦荡。
9/8/2025 9:16:00 AM

陶哲轩都惊了!o3首战「AI奥数」碾压夺冠,开源军团仅差5分狂追OpenAI

「AI奥数」第二届大赛,英伟达团队(NemoSkills)曾夺下第一! 这一次,AIMO2组委会再次重启赛题,OpenAI o3首次参赛,就拿下了最亮眼的成绩。 陶哲轩激动表示,过去,这个比赛仅限于开源模型,计算资源也卡得比较紧。
9/8/2025 9:15:00 AM

苹果端侧AI两连发!模型体积减半、首字延迟降85倍,iPhone离线秒用

就在刚刚,苹果在Hugging Face上重磅开闸:这一次不是零碎更新,而是FastVLM与MobileCLIP2两条多模态主线集中亮相。 一个主打「快」,把首字延迟压到竞品的1/85;另一个突出「轻」,在保持与SigLIP相当精度的同时,体积减半。 打开摄像头实时字幕、离线识别翻译、相册语义搜索,这些场景都能体验。
9/8/2025 9:14:00 AM

幸好图灵不是一位好棋手

咱就是说,还好祖师爷图灵不是一位国际象棋大师! 不然整个世界的AI发展脉络以及技术进展速度,可能和现在完全不一样……看到这儿有的人可能犯嘀咕:不是,为啥这么说啊? ?
9/8/2025 9:04:00 AM

大模型破译甲骨文创下新SOTA!复旦团队推出新框架

让大模型破译从未见过的甲骨文,准确率拿下新SOTA! 来自复旦大学的研究人员提出了一种基于部首和象形分析的可解释甲骨文破译框架——不仅在公开基准数据集HUST-OBC和EV-OBC上,达到最先进的Top-10识别准确率以及优异的零样本破译能力。 而且面对未破译甲骨文,所提方法也能够输出可解释性的分析文本,从而为考古破译工作提供潜在帮助。
9/8/2025 9:02:00 AM

你的 AI “体检”了吗?开源 AI 红队测试平台,一键自查三大风险

作者 | 腾讯朱雀实验室最近的AI圈,简直比好莱坞大片还精彩。 一边是各家的顶尖模型接连发布,技术狂欢席卷全球;另一边,这些看似无所不能的“最强大脑”却集体被成功“越狱”(Jailbreak)输出有害内容。 [大模型们的越狱“一日游”]而当我们回过头看,每个重磅发布的大模型都在经历类似的迅速失守,从23年的DAN(Do Anything Now)、24年的BoN(Best of N)到今年的回音室(Echo Chamber)与模型降级(PROMISQROUTE)攻击,各种新的通用越狱手法层出不穷,而在arXiv上截止到今年7月累计已有七百余篇越狱攻击相关论文。
9/8/2025 9:00:00 AM
腾讯程序员