资讯列表
为什么95%的智能体都部署失败了?这个圆桌讨论出了一些常见陷阱
「95% 的 AI 智能体在生产环境中部署时都失败了。 」在硅谷近期的一个圆桌论坛中,有位嘉宾给出了这样一个数字。 这个论坛由 EntreConnect(一个企业家、投资者社区)组织,来自 Uber、WisdomAI、EvenUp 和 Datastrato 的工程师及 ML 负责人参与了讨论。
10/28/2025 6:02:00 PM
机器之心
NeurIPS 2025|VFMTok: Visual Foundation Models驱动的Tokenizer时代来临
视觉 Tokenizer 的困境与破局近年来,自回归(Autoregressive, AR)模型在语言生成领域的成功激发了其在图像生成领域的应用,涌现出 DALL-E、Parti、VAR 和 LlamaGen 等代表性工作。 这类技术高度依赖于 VQGAN 等视觉 Tokenizer,它负责将高维、冗余的像素空间映射到一个低维、紧凑的离散潜在空间,是决定生成模型上限的基石。 然而,以 VQGAN 为代表的传统 Tokenizer 通常需要从零开始训练,其训练目标由像素级重建损失函数主导,导致其产生的潜在空间:富含低层细节特征却缺乏高层语义信息:能很好地还原图像细节,但潜在编码本身缺乏高层语义信息。
10/28/2025 5:54:00 PM
机器之心
Anthropic 推出新功能,Claude 为金融分析师提供强大工具
近日,Anthropic 宣布为其人工智能助手 Claude 推出一系列新功能,专门为金融分析师量身定制。 这些新功能包括 Excel 扩展、扩展的数据连接以及一套 AI 驱动的技能,旨在帮助分析师完成现金流建模和估值比较等任务。 其中,Claude for Excel 插件现已进入测试阶段,部分商业客户可以提前体验。
10/28/2025 5:26:26 PM
AI在线
豆包语音团队提出“AI多人有声剧”方案,效果媲美真人配音+后期
近日,豆包语音团队发布了“AI多人有声剧”自动化方案。 方案支持多角色、高表现力的TTS(语音合成)演播,同时实现了全自动AI后期的链路,从小说文本到高质量的多人有声剧成品,全部由AI端到端完成。 据了解,“AI多人有声剧”自动化方案基于高自然度的多角色智能朗读,配合AI后期自动添加音乐、音效、特效, 并进行智能混音,能够全自动生产媲美真人水准的有声剧作品。
10/28/2025 4:55:00 PM
新闻助手
多智能体系统大多只是表演!做了25+个Agent的开发老鸟警告:成本爆炸,延迟增加,Agent不是越多越好!
编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)今年以来,多智能体(Multi-Agents)频频成为AI领域的热点话题。 但现在,越来越多开发者发现,“多智能体协作”的酷炫演示,很多只是AI 的一场秀,并非切实可靠。 这两天,Reddit、X平台上关于多智能体的讨论再次甚嚣尘上。
10/28/2025 4:52:05 PM
听雨
站酷发布AI设计专用智能体,要让更多人成为超级设计师
10 月 28 日,2025 站酷设计周在北京开幕。 此次设计周以 “AI 时代的超级设计师” 为主题,集结了全球多位知名 “超级设计师”,站酷还正式发布了站酷 AI 设计工具“站酷设计 Agent” 。 AI 正如何影响与改变设计行业?
10/28/2025 4:29:00 PM
新闻助手
新范式!字节提出智能体上下文折叠框架,1/10活跃量突破长周期任务瓶颈
智能体在执行长周期任务时,始终受限于上下文长度。 为此,字节联合提出上下文折叠(Context-Folding)框架,使智能体能够主动管理其工作上下文。 该框架允许智能体通过程序分支进入子轨迹以处理子任务,完成后将中间步骤折叠压缩,仅保留结果摘要。
10/28/2025 3:53:21 PM
六一
地理学的AlphaEvolve?MIT斯坦福让AI自我生长、懂地理、懂世界
以下或许是一位地理科研工作者的日常:为了让所需的地理模型表现得更好,他不断和大模型(如ChatGPT)对话,尝试改进代码或修复bug。 大模型给出的初版答案往往并不完美,于是研究者又会根据结果提出新的修改意见。 就这样一来一回,经过不断交互,代码逐渐被打磨得完善。
10/28/2025 3:46:19 PM
新智元
90后王虹连夺两大「菲尔兹奖」风向标!韦神都来听她讲课,陶哲轩盛赞
今天,34岁中国数学家王虹,拿下了2025 Salem Prize(塞勒姆奖)。 因在调和分析与几何测度论领域重大未解问题上的卓越贡献,获此殊荣。 在业界,它被誉为「菲尔兹」风向标。
10/28/2025 3:37:11 PM
VAE再被补刀!清华快手SVG扩散模型亮相,训练提效6200%,生成提速3500%
前脚谢赛宁刚宣告VAE在图像生成领域退役,后脚清华与快手可灵团队也带着无VAE潜在扩散模型SVG来了。 该方法实现了在训练效率上62倍、生成速度上35倍的提升。 VAE为何被接连抛弃?
10/28/2025 3:35:11 PM
闻乐
豆包语音团队提出“AI多人有声剧”,效果媲美真人配音+后期
近日,豆包语音团队发布了“AI多人有声剧”自动化方案。 方案支持多角色、高表现力的TTS(语音合成)演播,同时实现了全自动AI后期的链路,从小说文本到高质量的多人有声剧成品,全部由AI端到端完成。 据了解,“AI多人有声剧”自动化方案基于高自然度的多角色智能朗读,配合AI后期自动添加音乐、音效、特效, 并进行智能混音,能够全自动生产媲美真人水准的有声剧作品。
10/28/2025 3:34:08 PM
十三
Hailuo2.3AI视频生成模型上线Replicate平台,带来逼真物理与电影级特效
中国AI初创公司MiniMax旗下最新视频生成模型Hailuo2.3现已在Replicate平台正式上线,这一升级版工具以其高度逼真的物理模拟和流畅动作捕捉能力,迅速引发AI内容创作领域的关注。 该模型支持文本和图像输入生成高品质视频,标志着AI在动态视觉效果上的又一突破,尤其适用于电影制作、广告和数字娱乐。 Hailuo2.3延续了前代Hailuo02的Noise-Aware Computation Redistribution (NCR)架构,训练效率提升2.5倍,支持高达10秒的原生1080p视频输出。
10/28/2025 3:16:21 PM
AI在线
红杉资本注资Rogo Technologies,AI 工具或将颠覆初级银行家角色
据知情人士透露,红杉资本正在积极投资于初创公司 Rogo Technologies Inc.,此次投资的估值达到了7.5亿美元。 Rogo 是一家位于纽约的公司,专注于开发人工智能工具,以提升投资银行家的工作效率。 该公司的目标是创造出具有银行分析师水平的 AI 系统,以应对日益复杂的金融市场需求。
10/28/2025 3:16:21 PM
AI在线
LSTM之父Jürgen再突破,「赫胥黎-哥德尔机」让AI学会自己进化
实现通用人工智能的一大终极目标就是创建能够自我学习,自我改进的人工智能体。 这个目标已经是老生常谈了。 其实在 2003 年,能够自我改进的智能体的理论模型就已经由著名的「现代 AI 之父」Jürgen Schmidhuber 提出,称为哥德尔机。
10/28/2025 2:47:00 PM
机器之心
大模型优秀大脑齐聚硬核开源聚会,SGLang社区举办国内首次Meetup
远在大洋彼岸的 Pytorch Conference 2025 全球开发者峰会已经走向尾声。 作为全世界最具影响力的深度学习开发者社区的重大活动之一,Pytorch Conference 最近收获了相当的关注度,展现了相当的社区活力。 SGLang 同样参加了Pytorch Conference 2025,核心成员Yineng Zhang 在大会做了相关分享。
10/28/2025 2:42:00 PM
机器之心
NeurIPS 2025 | 北大联合小红书提出Uni-Instruct:ImageNet单步生图FID进入1.0时代!
近年来,单步扩散模型因其出色的生成性能和极高的推理效率,在图像生成、文本到视频、图像编辑等领域大放异彩。 目前主流的训练方法是通过知识蒸馏,最小化学生模型与教师扩散模型之间的分布差异。 然而,现有的方法主要集中在两条平行的理论技术路线上:基于 KL 散度最小化的方法(如 Diff-Instruct[1],DMD[2] 等):收敛速度快,但可能存在模式崩溃问题,进而导致生成性能差。
10/28/2025 2:36:00 PM
机器之心
华为世界模型来了!单卡30分钟生成272㎡场景
闻乐 发自 凹非寺. 量子位 | 公众号 QbitAIAI大house真来了。 华为联合上海交通大学、华中科技大学推出了世界模型WordGrow,可以生成1800㎡超大室内场景(19×39块),单卡30分钟就跑了272㎡。
10/28/2025 2:27:24 PM
闻乐
量子计算机用新算法成功模拟简化SYK模型,解决强相互作用系统的模拟难题
编辑丨%在量子物理的版图里,有一类系统被称为「最难模拟的存在」。 它们像黑洞一样混沌,又像晶体那样多体耦合。 理论家用方程描述它们,计算机却束手无策——哪怕最强的超级计算机,也无法追踪上千亿个量子态的演化。
10/28/2025 2:26:00 PM
ScienceAI