AI在线 AI在线

资讯列表

长文本检索新突破!斯坦福RAPTOR:用递归树结构兼顾语义深度与细节,刷新多数据集SOTA

在大语言模型(LLMs)主导的AI时代,“检索增强”早已成为提升模型事实准确性、降低幻觉的核心技术。 然而,当前主流的检索方法仍面临一个关键瓶颈:无论是传统的BM25、基于深度学习的DPR,还是新兴的LLM检索器,大多依赖“文本分块 单一维度匹配”的模式,难以捕捉长文本(如学术论文、书籍章节)中的层次化语义结构——要么因只取片段丢失上下文,要么因过度抽象遗漏关键细节。 斯坦福大学团队在2024年ICLR提出RAPTOR(Recursive Abstractive Processing for Tree-Organized Retrieval),用“递归树状检索”的新思路打破了这一困境。
9/15/2025 9:25:26 AM
Goldma

微软用「光」跑AI登上Nature!100倍能效颠覆GPU,华人首席研究员扛鼎

过去的几十年,各大公司都在芯片上暗暗较劲:芯片涨价、GPU短缺、AI算力焦虑...就在大家盯着芯片迭代升级时,微软在悄悄做另一件事:用光重新定义计算。 他们花了四年,用手机摄像头、Micro LED和透镜,拼出了一台模拟光学计算机(AOC)。 如今,这个实验已经登上Nature,带来了一个足以颠覆GPU的未来想象。
9/15/2025 9:15:00 AM

GPT-5是口袋博士?诺奖得主哈萨比斯怒怼奥特曼:博士级AI纯属扯淡!

目前的博士级人工智能就是扯淡! 实属没想到,诺奖得主、谷歌DeepMind CEO哈萨比斯(Demis Hassabis)竟公然怒怼奥特曼。 在最近的访谈中,哈萨比斯公开表示,把如今的LLM称作「博士级智能」,纯属无稽之谈!
9/15/2025 9:13:00 AM

"顿悟"会传染,94%性能跃升:SAPO如何用“共享经验”重构小模型RL训练

大家好,我是肆〇柒。 我看到了一个很有趣的研究,它涉及经验共享,群体RL进化。 今天我们要探讨的,不是来自谷歌或OpenAI的最新成果,而是一家名为Gensyn AI的前沿研究团队提出的革命性想法。
9/15/2025 9:12:53 AM
肆零柒

干货!2025年AI Agent超100页全景报告:MCP、RAG、实战案例

知名AI、数据科学家Avi Chawla最近精心整合关于AI Agent的,117页PDF的全景技术报告。 这份报告的内容非常全面,无论是技术新手或老手都能深度了解关于智能体的相关内容。 在基础理论部分,清晰阐述基础概念,深入剖析大模型、RAG与智能体的区别和关系,帮助开发者构建扎实认知根基。
9/15/2025 9:12:40 AM

大模型不再是“万能钥匙”?探秘 AI 初创公司的新策略与挑战

据techcrunch报道, 曾经被视为 AI 领域“皇冠上的明珠”的基础模型,其主导地位正在面临前所未有的挑战。 AI 初创公司的焦点已悄然转向面向特定任务的定制化模型和用户界面,将基础模型视为可替换的“商品”。 这一趋势在近期的 Boxworks 会议上表现得尤为明显,整个行业似乎正在告别对通用人工智能(AGI)的追逐,转而进入一个分散化、专业化的新时代。
9/15/2025 9:11:35 AM
AI在线

重磅!5年破解黎曼猜想,10年接管人类认知,AI超级增长曲线揭秘

「如果未来五年内看到 AI 解出黎曼猜想,我一点也不会太惊讶。 」近日,Epoch AI负责人Jaime Sevilla,与公司数据与分析负责人Yafah Edelman在一次播客节目中,为我们揭示了未来十年,AI的发展路线图。 Jaime Sevilla(左)与Yafah Edelman(右)对话谈到了以下问题:我们是否会持续每年5x的算力扩张节奏?
9/15/2025 9:11:00 AM

阿里巴巴Mobile-Agent-v3震撼发布!国产移动AI突破苹果谷歌封锁

你有没有想过,有一天国产AI会在移动端彻底"反杀"苹果和谷歌? 昨天看到阿里巴巴发布Mobile-Agent v3的消息时,我第一反应是,牛逼(破音~)。 说实话,国产AI在移动端的表现一直让人不太满意。
9/15/2025 9:10:18 AM
阿丸笔记

昔日王者TensorFlow,已死

噫吁嚱! 那个昔日叱咤风云的开源框架——TensorFlow,已然是行将就木了。 如此断言并非空穴来风,而是根据一份冷静的数据洞察所得出的结论。
9/15/2025 9:10:09 AM

马斯克深夜挥刀,Grok幕后员工1/3失业!谷歌AI靠人肉堆起,血汗工厂曝光

昨天,马斯克xAI内部曝出最大规模裁员。 标注团队中,500名通用标注员一夜被炒鱿鱼,Slack群聊人数(1500人)骤降至1000人。 与此同时,xAI将招募10倍「专业导师」团队。
9/15/2025 9:04:00 AM

啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了

不得了,这个名叫Gauss(高斯)的新AI Agent,有点杀疯了的感觉。 因为它只用了三周的时间,就完成了陶哲轩和Alex Kontorovich提出的数学挑战——在Lean中形式化强素数定理(Prime Number Theorem,PNT)。 要知道,陶哲轩和Kontorovich在2024年1月提出这个挑战后,足足花了18个月(今年7月)的时间,也才取得阶段性的进展。
9/15/2025 9:00:00 AM

突发!苹果AI大失血:Siri前掌门离职,核心团队被挖角,新功能延期到2026

高管出走、人才流失新品发布会因缺乏「AI进展」被投行降级Siri升级延期,新AI功能未就绪Apple Intelligence落地受限……从年中高调,到9月「轻AI」的产品发布,苹果AI近半年来在跌宕中失速。 近日,苹果AI高层再传震荡:前Siri负责人、AI资深高管Robby Walker即将离任。 Walker是AI负责人John Giannandrea的少数直接汇报人之一。
9/15/2025 8:54:00 AM

攻克强化学习「最慢一环」!交大字节联手,让大模型RL训练速度飙升2.6倍

强化学习的训练效率,实在是太低了! 随着DeepSeek、GPT-4o、Gemini等模型的激烈角逐,大模型“深度思考”能力的背后,强化学习(RL)无疑是那把最关键的密钥。 然而,这场竞赛的背后,一个巨大的瓶颈正悄然限制着所有玩家的速度——相较于预训练和推理,RL训练更像一个效率低下的“手工作坊”,投入巨大但产出缓慢。
9/15/2025 8:50:00 AM

谷歌DeepMind用AI探测引力波,登上Science了

探测宇宙深处的时空涟漪引力波,AI也派上用场了。 谷歌DeepMind、LIGO(激光干涉仪引力波探测器)团队和GSSI(格兰萨索科学研究所)合作开发的Deep Loop Shaping技术,将引力波探测的低频降噪能力拉到了新高度。 该研究现已登上Science。
9/15/2025 8:40:00 AM

人格陷阱:AI如何假装人类

译者 | 核子可乐审校 | 重楼最近有个趣闻:一位女士在邮局排队时跟工作人员争执起来,原因是ChatGPT说邮政网站上公布了“保价承诺”,但实际上这只是AI的幻觉。 而相较于信任面前的邮政人员,这位女士显然更相信AI的建议——AI在她眼中不只是文本生成器,更像是“带来神谕的使者”。 也就是说,很多人对于AI聊天机器人存在着根本性误解。
9/15/2025 8:00:57 AM
核子可乐

Qwen-Image:AI 设计师新搭档,文字排版不再是难题

在生成式 AI 日益成熟的今天,图像生成/编辑能力的发展越来越受到人们的期待。 而在所有能力中,“文字渲染”(尤其是中文/中英混排/长段落/复杂布局字体等)的精度,一直是个难点。 今天,我们要介绍的是通义千问系列中的最新图像基础模型 —— Qwen-Image,它在文字渲染与图像编辑方面取得了显著突破,是内容创作者、设计师和视觉工作者的有力助手。
9/15/2025 5:00:00 AM
AI大模型应用开发

推理的深度边界:神经网络如何在有限参数下实现多步推理?

大家好,我是肆〇柒。 今天要和大家分享的这项突破性研究来自MBZUAI(穆罕默德·本·扎耶德人工智能大学)、莫斯科物理技术学院神经网络与深度学习实验室、莫斯科人工智能研究院以及伦敦数学科学研究所的联合团队。 这项研究通过精心设计的1dCA基准,首次清晰地区分了模型的规则抽象能力和多步状态传播能力,为我们理解神经网络的"思考"机制提供了新视角。
9/15/2025 4:00:00 AM
肆零柒

Qwen3-Next 发布:通义千问的训练&推理效率革命

近日,阿里巴巴旗下的通义千问(Qwen)团队发布了全新模型 Qwen3-Next,在保持性能的同时大幅提升训练与推理效率,引起了 AI 界广泛关注。 下面带大家深入了解一下 Qwen3-Next 的亮点、技术突破,以及它对未来应用的意义。 什么是 Qwen3-NextQwen3-Next 是 Qwen 系列的最新成员,基于 Qwen3 架构进行改进与优化。
9/15/2025 3:00:00 AM
AI大模型应用开发