资讯列表
攻克强化学习「最慢一环」!交大字节联手,RL训练速度飙升2.6倍
强化学习的训练效率,实在是太低了! 随着DeepSeek、GPT-4o、Gemini等模型的激烈角逐,大模型“深度思考”能力的背后,强化学习(RL)无疑是那把最关键的密钥。 然而,这场竞赛的背后,一个巨大的瓶颈正悄然限制着所有玩家的速度——相较于预训练和推理,RL训练更像一个效率低下的“手工作坊”,投入巨大但产出缓慢。
9/13/2025 4:45:23 PM
鹭羽
他同时参与创办OpenAI/DeepMind,还写了哈利波特同人小说
这是硅谷版世界末日传教士Eliezer Yudkowsky的最新论点。 Yudkowsky用现在的话说,是个不折不扣的斜杠青年,是MIRI创始人,也是著名的哈利波特同人文作者。 但最引人注目的身份则是一手缔造OpenAI和谷歌DeepMind的中之人。
9/13/2025 4:43:06 PM
鹭羽
AI水论文还得AI治:西湖大学首次模拟人类专家思考链,AI审稿分钟级给出全面反馈
审稿不用再等了,高质量的AI审稿平台来了! 如今,AI生成的论文数量激增,如何从海量的AI “水文”中筛选出真正高质量的研究成果,已经成为学术界必须直面的难题。 为此,西湖大学自然语言处理实验室推出了首个AI生成学术成果的开放预印本平台AiraXiv,以及首个模拟人类专家思考链的AI审稿人系统DeepReview。
9/13/2025 2:10:27 PM
梦晨
扩散语言模型也有MoE版本了!蚂蚁&人大从头训练LLaDA-MoE,即将完全开源
挑战自回归的扩散语言模型刚刚迎来了一个新里程碑:蚂蚁集团和人大联合团队用 20T 数据,从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。 该模型虽然激活参数仅 1.4B,但性能可以比肩参数更多的自回归稠密模型 Qwen2.5-3B,而且推理速度更快。 这为扩散语言模型的技术可行性提供了关键验证。
9/12/2025 9:34:00 PM
机器之心
如何为LLM智能体编写工具?Anthropic官方教程来了
好工具,才有好智能体。 智能体(Agent)时代,工具已不再只是传统 API 或函数接口的简单封装,而是决定智能体能否高效完成任务的关键。 为了让智能体真正释放潜力,我们需要重新思考工具开发的方式。
9/12/2025 9:26:00 PM
机器之心
腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破
图检索增强生成(GraphRAG)已成为大模型解决复杂领域知识问答的重要解决方案之一。 然而,当前学界和开源界的方案都面临着三大关键痛点:开销巨大:通过 LLM 构建图谱及社区,Token 消耗大,耗时长,经济与时间成本高昂。 效果瓶颈:对复杂问答的解析精度有限,面临显著的效果瓶颈。
9/12/2025 9:21:00 PM
机器之心
高德AI出行智能体“小高老师”月活突破4亿
在近日召开“高德扫街榜”产品发布会上,高德地图对外宣布,其面向出行生活打造的智能体(Agent)“小高老师”单日调用量已达12亿次。 最新数据显示,上线不到一个月,“小高老师”的月活跃用户数已突破4亿,同时它也成为高德连接用户与生活服务的重要载体。 目前,高德地图上每天有1.2亿次生活服务AI搜索,而“小高老师”日均推荐的生活服务类点位超6300万个。
9/12/2025 8:49:01 PM
量子位的朋友们
云原生边缘与AI训练场景:两类高频隐蔽Bug的深度排查与架构修复
在云原生技术向边缘计算与AI训练场景的过程中,基础设施层的问题往往会被场景特性放大——边缘环境的弱网络、异构硬件,AI训练的高资源依赖、分布式协作,都可能让原本隐藏的Bug以“业务故障”的形式爆发。 这些问题大多不具备直观的报错信息,而是表现为任务崩溃、数据断连等表层现象,若仅从业务层排查,很容易陷入“调参无效、重启治标”的循环。 本文结合两个真实生产场景的高频Bug,从技术环境还原到根因拆解,再到架构级修复方案,完整呈现问题解决的全链路,为云原生运维与AI研发团队提供可复用的实践经验,避开那些文档未提及、经验难复制的隐性陷阱。
9/12/2025 6:17:31 PM
许辉
Science Advances | AI for Earth:聆听海洋的「脉搏」,新一代AI大模型精准预测十年气候脉动
作者 | 论文团队编辑 | ScienceAI地球的未来,写在海洋的每一寸波澜里。 近日,一篇发表于《Science Advances》的重磅研究,为我们破译海洋这部「天书」提供了一种全新的视角。 由上海人工智能实验室、复旦大学、南京信息工程大学等多家国际顶尖机构联合攻关,该研究构建了一个名为 ORCA-DL 的数据驱动全球海洋模型。
9/12/2025 5:57:00 PM
ScienceAI
支付宝推出 AI 智能皮肤检测:轻松拍脸获取肤质报告与护理建议
在2025Inclusion 外滩大会上,支付宝的蚂蚁 AI 健康管家 AQ 发布了多项新功能。 其中最引人注目的便是全新上线的 “AI 智能皮肤检测” 功能。 用户只需拍摄自己的脸部照片,便能迅速获得一份详细的肤质检测报告和个性化的护理建议。
9/12/2025 5:36:07 PM
AI在线
医学教育革命来袭!复旦中山医院推出AI教学大模型,培养有温度的未来医生
医学这门古老而神圣的学科,正在经历一场前所未有的教育变革。 知识爆炸式增长,临床实践日益复杂,传统的医学教育模式已经难以跟上时代的步伐。 面对这些挑战,复旦大学附属中山医院在9月12日交出了一份令人瞩目的答卷。
9/12/2025 5:36:07 PM
AI在线
实测!Qwen下一代基础架构突袭!秒解AIME数学竞赛题,提速10倍+,性价比提升10倍
Qwen下一代模型架构,抢先来袭! Qwen3-Next发布,Qwen团队负责人林俊旸说,这就是Qwen3.5的抢先预览版。 基于Qwen3-Next,团队先开源了Qwen3-Next-80B-A3B-Base。
9/12/2025 5:19:38 PM
外滩大会嘉宾锐评AGI即将“撞墙”,正在向数字与物理世界进化
9月11日,2025 Inclusion·外滩大会“AGI:数字与物理世界的共同进化”见解论坛成功举办。 本次论坛由蚂蚁集团主办,中国信通院华东分院承办,智源社区与智东西支持,汇聚了来自学术界、产业界的十余位顶尖专家,共同探讨人工智能技术的最新进展和实际应用。 大模型参数破万亿后,Scaling Law边际收益递减,“单点暴力”已难撬动通用智能。
9/12/2025 5:17:00 PM
新闻助手
清华首次提出数据驱动控制新形式,算法效率直翻三倍
当大数据席卷各行各业,控制理论也迎来新的拐点:从依赖模型到依赖数据。 但是,在数据驱动控制领域,却缺乏一种标准化的数据表示形式。 针对这一问题,清华大学李升波教授课题组(iDLab)首次将现代控制理论中的标准型概念引入数据驱动控制(datatic control)范式,提出了一种基于数据的系统描述新形式。
9/12/2025 5:03:51 PM
时令
倒计时1天 | 来服贸会参加一场贯穿AI与算力全景生态的活动
2025年,AI技术演进正呈指数级加速,当我们惊叹于AIGC的创造力时,你是否想过,我们日常接触的AI应用,或许只是整个庞大技术体系中的冰山一角? 应用之下,是由算力、数据、模型和基础设施共同构筑的庞大基石。 吴恩达教授在最近的公开发言中也指出,AI技术栈从底层的半导体,到云平台,再到基础模型,环环相扣,最大的机会存在于应用层。
9/12/2025 5:00:17 PM
量子位的朋友们
高德一夜刷榜:十亿用户用脚投票,美食到店榜单乱象被AI横扫
阿里藏了3个月,亮相即提4个热搜。 万众瞩目的神秘项目,「高德扫街榜」终于揭开了庐山真面目……热议中有夸赞和激动,终于有人出来整顿到店和评价的乱象了。 讨论里也有质疑:已经固化了十多年的格局,阿里和高德,凭什么一夜打破?
9/12/2025 4:55:31 PM
港科大 X MiniMax:高质量数据、小模型挑战复杂网络搜索难题
当AI遇上复杂网络搜索随着大型语言模型(LLM)的快速发展,AI Agent的能力边界不断扩展。 网络搜索Agent作为这一发展的重要组成部分,能够自主地从广泛的在线资源中检索信息。 然而,现有的开源网络Agent在处理复杂搜索任务时表现有限,而更强大的商业模型又缺乏透明的训练细节。
9/12/2025 4:54:00 PM
特邀精选
火山引擎多媒体实验室重要突破!LiveGS 技术登榜 SIGGRAPH,重新定义移动端自由视角视频直播
近日,火山引擎多媒体实验室的最新研究成果 LiveGS: Live Free-Viewpoint Video via High-Performance Gaussian Splatting for Mobile Devices 成功入选计算机图形学顶会 SIGGRAPH Emerging Technologies,并于2025年8月10日至8月14日在加拿大温哥华对外展出。 这一技术突破首次实现了移动端实时自由视角视频(FVV)直播的完整链路落地,在视觉保真度、计算效率和传输成本之间达成了前所未有的平衡,为互动直播、沉浸式娱乐等场景开辟了技术新范式。 图1 论文主页打破技术瓶颈:从实验室走向移动端的实时自由视角革命自由视角视频(FVV)允许用户从任意角度探索场景,是元宇宙、沉浸式直播等前沿领域的核心技术。
9/12/2025 4:51:20 PM
多媒体实验室