AI在线 AI在线

资讯列表

谷歌揭秘:Multi-Agent 推理时扩展才是未来

这里是一个专注于前沿AI和智能体的频道~谷歌 DeepMind 和 MIT 联合发了一篇论文,名叫 TUMIX(Tool-Use Mixture)。 大概就是说,Multi-Agent 才是 test-time- scaling的终极打开方式,可以以一半的成本,在HLE上,准确率从 21.6% 飙升到 34.1%,超越 Gemini-2.5-Pro Deep Research。 除此之外,他们还做了一个彩蛋,让Agent设计Agent,效果比人工设计的更牛~图片一个反常识Agent多样性 疯狂采样目前主流的推理时扩展方法是什么?
10/15/2025 2:11:00 AM
猕猴桃

Agentic AI:构建长期记忆

如果你用过大型语言模型(LLMs),你就会知道它们是无状态的。 如果没用过,可以把它们想象成没有短期记忆的东西。 举个例子,就像电影《记忆碎片》(Memento)里的主角,他总是需要靠便利贴上的信息来提醒自己发生了什么,拼凑出下一步该做什么。
10/15/2025 2:00:00 AM
AI研究生

MCP Streamable HTTP Transport 与 SSE:专用通道与通用协议的辨析,内附mcp的示例代码

一、MCP Streamable HTTP Transport 与 SSE:技术选型辨析在构建需要实时数据流的AI应用时,MCP 的 Streamable HTTP Transport 和传统的 Server-Sent Events 是两种常见的备选方案。 虽然它们都旨在实现服务器到客户端的单向数据推送,但其设计目标、协议层级和应用场景有着本质区别。 核心定义SSE:一种 Web 标准协议SSE 是一个基于 HTTP 的轻量级标准。
10/15/2025 1:44:00 AM
AI小新

模型压缩技术揭秘:量化、剪枝、蒸馏三大法宝

核心内容1. 模型量化的原理与方法:降低参数精度,减少存储与计算成本2. 模型剪枝的技术分类:结构化与非结构化剪枝的优缺点对比3.
10/15/2025 1:15:00 AM
大西瓜

147 次失败后的神级 Prompt:Reddit 爆火的「Lyra」是什么?

Lyra:一个在 Reddit 火起来的神秘 Prompt小伙伴们好呀,最近在 Reddit 上看到这样一篇爆火的帖子:“After 147 failed ChatGPT prompts, I had a breakdown and accidentally discovered something”图片作者说在经历了 147 次失败后,构建了一个叫 “Lyra” 的 meta-prompt 。 并宣称这是 一个颠覆整个交互模型的元提示 (那我不得好好看一看怎么个颠覆法! )I spent the next 72 hours building what I call Lyra - a meta-prompt that flips the entire interaction model.Prompt 这么长👇图片下面来进行邪修解读 👇角色设定复制这是最开始的 Prompt,一段 角色设定 ,比较常见。
10/15/2025 1:10:00 AM
Java4ye

ACE代理上下文工程:构建自我改进的大语言模型新范式

摘要在人工智能快速发展的今天,大语言模型(LLM)的应用场景日益复杂,从简单的文本生成扩展到复杂的代理系统和领域专业推理。 传统的模型优化方法主要依赖于权重更新,但这种方式在实际部署中面临着成本高、灵活性差等挑战。 斯坦福大学、SambaNova Systems和加州大学伯克利分校的研究团队提出了一种革命性的解决方案——ACE(Agentic Context Engineering,代理上下文工程)框架,该框架通过动态构建和优化输入上下文而非更新模型参数来提升LLM性能。
10/15/2025 1:00:00 AM
葱葱

OpenAI自研芯片内幕曝光!18个月前开始用AI优化芯片设计,比人类工程师更快

“用模型优化芯片设计,比人类工程师更快。 ”“合作水到渠成,相关项目已经持续了约18个月……”好家伙,就在OpenAI博通官宣完合作之后,双方头头儿开始齐聚一堂亲口爆料了! OpenAI这边派出了CEO奥特曼(右2)和总裁Greg Brockman(右1),博通则派出了总裁兼CEO Hock Tan(C位)以及半导体解决方案事业群总裁Charlie Kawwas(左2)。
10/15/2025 12:00:05 AM

国内安全厂商应对大模型新风险的主要措施

大型语言模型(LLMs)的飞速发展,正在为企业带来前所未有的业务创新,但同时也带来了一系列超出传统网络安全范畴的“新”威胁。 攻击者不再满足于入侵服务器,而是通过恶意输入来操纵模型行为、窃取模型数据甚至损害模型本身,这些新威胁使得为大模型构建一个强大的安全防护体系,成为企业在AI时代下的当务之急。 那么,国内厂商是如何应对这些“新”威胁,我们又该如何防御呢?
10/15/2025 12:00:00 AM

半年估值翻3倍!Cursor冲刺270亿美元,AI编程工具成资本新宠

据 The Information 报道,Coatue 和 Accel 正在与知名 AI 编码助手 Cursor 的母公司 Anysphere 商谈一笔至少10亿美元的融资,融资前估值高达270亿美元。 今年6月,Accel 以99亿美元估值参与了上一轮融资,短短几个月后估值几乎翻了三倍。 过去两年,Accel 在 Scale AI、Cyera 等项目上都采取了类似的持续加仓策略,精准卡位 AI 基础设施赛道。
10/14/2025 6:06:40 PM
AI在线

​印度将在 2026 年与 Anthropic 共同举办全球人工智能峰会

人工智能公司 Anthropic 宣布与印度政府达成重要合作,计划于2026年2月共同主办全球人工智能峰会。 这一峰会将成为国际人工智能领域的一项重要盛事,旨在汇聚全球的顶尖专家、学者以及企业领袖,分享最新的 AI 技术发展和应用趋势。 此次峰会的举办地尚未确定,但预计将吸引来自各国的参与者,涵盖人工智能的多个领域,包括机器学习、自然语言处理和自动化技术等。
10/14/2025 6:06:39 PM
AI在线

左手增程右手纯电,油电皆可极狐全新阿尔法T5预售12.38万起

作为家庭用户购车的黄金腹地,中级SUV产品以其均衡全能的价值,赢得了庞大的消费群体。 市场火爆的背后用户也有不少纠结:增程SUV续航里程长但是静谧性差、馈电性能弱,体验没有保障;纯电SUV动力来得快、开起来很安静,但续航里程往往不太够用。 极狐全新阿尔法T5让这个难题迎刃而解,以新一代增程技术彻底消除传统增程车的痛点,同时把纯电中级SUV的续航里程做到最长达705公里,中级SUV的市场空白从此被填补!
10/14/2025 5:48:00 PM
新闻助手

谢赛宁新作:VAE退役,RAE当立

时令 发自 凹非寺. 量子位 | 公众号 QbitAI昔日风光无限的VAE,终于被宣判“退役”? 谢赛宁团队最新研究给出了答案——VAE的时代结束,RAE将接力前行。
10/14/2025 4:54:00 PM
时令

VAE时代终结?谢赛宁团队「RAE」登场,表征自编码器或成DiT训练新基石

存在 10 多年后,VAE(变分自编码器)时代终于要淘汰了吗? 就在今天,纽约大学助理教授谢赛宁团队放出了新作 ——VAE 的替代解决方案 ——RAE(Representation Autoencoders,表征自编码器)。 他表示,三年前,DiT(Diffusion Transformer) 用基于 Transformer 的去噪骨干网络取代了传统的 U-Net。
10/14/2025 4:46:00 PM
机器之心

老牌Transformer杀手在ICLR悄然更新:Mamba-3三大改进趋近设计完全体

至今为止 Transformer 架构依然是 AI 模型的主流架构,自从其确立了统治地位后,号称 Transformer 杀手的各类改进工作就没有停止过。 在一众挑战者中最具影响力的自然是 2023 年社区爆火的基于结构化的状态空间序列模型(SSM)架构的 Mamba。 Mamba 的爆火可能和名字有关,但硬实力确实强大。
10/14/2025 4:40:00 PM
机器之心

NeurIPS 25 | 中大&UC Merced等开源RAPID Hand,重新定义多指灵巧手数据采集

在最近的一篇 NeurIPS 25 中稿论文中,来自中山大学、加州大学 Merced 分校、中科院自动化研究所、诚橙动力的研究者联合提出了一个全新开源的高自由度灵巧手平台 — RAPID Hand (Robust, Affordable, Perception-Integrated, Dexterous Hand)。 论文标题:RAPID Hand: A Robust, Affordable, Perception-Integrated, Dexterous Manipulation Platform for Generalist Robot Autonomy论文地址:: 地址:。 无论是日常的家庭整理、物品归置,还是辅助类服务任务,若缺乏灵巧的操作能力,机器人便难以真正完成复杂交互。
10/14/2025 4:36:00 PM
机器之心

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI找AI帮忙不要再客气了,效果根本适得其反。 宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示,你说话越粗鲁,LLM回答越准。
10/14/2025 4:30:49 PM
闻乐

农业智能化新突破!中国农业大学发布神农大模型3.0

在2025世界农业科技创新大会上,中国农业大学于10月13日发布了神农大模型3.0。 这一新版本的大模型覆盖了全国农业学科与应用场景,标志着我国农业人工智能发展进入了一个新的阶段。 神农大模型3.0聚焦于36个农业智能体,核心目标是实现 “小体积、高智能、低成本”。
10/14/2025 4:07:10 PM
AI在线

谷歌在美国投资 90 亿美元,推动人工智能未来

近日,谷歌宣布将在南 卡罗来纳州进行一项高达90亿美元的投资,以扩展其数据中心的建设。 这项投资不仅显示出谷歌对人工智能基础设施日益增长的需求的响应,同时也标志着南 卡罗来纳州在数字经济领域的转型。 谷歌此前已承诺在南 卡罗来纳州投资33亿美元,现在再加上这90亿美元的承诺,显示出该公司在东南部市场的雄心。
10/14/2025 4:07:10 PM
AI在线