AI在线 AI在线

资讯列表

3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

近期,阿里巴巴 ROLL 团队(淘天未来生活实验室与阿里巴巴智能引擎团队)联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构(Asynchronous Training)、Asymmetric PPO(AsyPPO)与 Attention 机制(Attention-based Reasoning Rhythm),「3A」彼此间并非孤立的技术堆砌,而是深度耦合,致力于共同推动「强化学习用于大语言模型(RL4LLM)」迈向高效、精细与可解释的新范式。 具体来看,ROLL Flash 以解耦为核心,通过「细粒度并行」与「采样 - 训练解耦」两大原则,将生成、环境交互、奖励计算与模型训练彻底流水线化,实现全链路异步执行,显著提升 GPU 利用率,同时通过「异步比」机制保障训练稳定性,集成主流 Off-policy 算法等,使得异步训练效果能与同步训练相媲美。 算法架构层面,AsyPPO 首次系统论证了评论家的参数规模与其价值估计能力并无必然关联,仅需两个小型评论家,即可在显著降低计算资源消耗的同时,提升推理性能与训练鲁棒性。
11/10/2025 1:36:00 PM
机器之心

与DeepSeek-OCR不谋而合,NeurIPS论文提出让LLM像人一样读长文本

在 NeurIPS 2025 论文中,来自南京理工大学、中南大学、南京林业大学的研究团队提出了一个极具突破性的框架 ——VIST(Vision-centric Token Compression in LLM),为大语言模型的长文本高效推理提供了全新的 “视觉解决方案”。 值得注意的是,这一思路与近期引起广泛关注的 DeepSeek-OCR 的核心理念不谋而合。 研究背景在处理短文本时,大语言模型(LLM)已经表现出惊人的理解和生成能力。
11/10/2025 1:19:00 PM
机器之心

2025宝山・智能机器人产业大会暨嘉年华启动在即

当 AI 大潮席卷全球,智能机器人产业正站在发展的关键节点 —— 未来发展方向何在? 产业要素如何协同? 全要素、全产业链的生态如何构建?
11/10/2025 1:12:00 PM
机器之心

NeurIPS2025 Spotlight | RobustMerge: 多模态大模型高效微调模型合并的全新范式

在 AI 技术飞速发展的今天,如何高效地将多个专业模型的能力融合到一个通用模型中,是当前大模型应用面临的关键挑战。 全量微调领域已经有许多开创性的工作,但是在高效微调领域,尚未有对模型合并范式清晰的指引。 因此,中科院、中山大学、北京大学的研究团队针对高效微调模型合并,提出了「方向鲁棒性」的概念,首次揭示了参数高效微调(PEFT)模块合并失败的根本原因是「方向不鲁棒」,而非传统认为的「符号冲突」,并提供了一个简单高效、无需额外成本的解决方案(RobustMerge)。
11/10/2025 1:08:00 PM
机器之心

谢赛宁、李飞飞、LeCun联手提出多模态LLM新范式,「空间超感知」登场

纽约大学助理教授谢赛宁新作又来了,合著者还有李飞飞、Yann LeCun。 这次的成果名为「Cambrian-S」,根据谢赛宁的说法,它既是一种观点,也是一个数据集、一个基准或者一个模型,代表其迈出了探索视频空间超感知的第一步。 从名称上来看,Cambrian-S 是谢赛宁团队去年研究成果「Cambrian-1」的延续。
11/10/2025 1:00:00 PM
机器之心

MeshCoder:以大语言模型驱动,从点云到可编辑结构化物体代码的革新

生成式 AI 的浪潮赋予了机器无尽的创造力,我们已亲眼见证它在文字与图像世界 “点石成金” 的魔力。 然而,当这股浪潮涌向更复杂的三维空间,挑战也随之升级。 过去的 3D 生成 AI 如孩童堆积木,成果粗糙模糊;如今,它渴望成长为一名 “数字建筑师”,去建造结构精巧、可被编辑改造的虚拟世界。
11/10/2025 12:01:00 PM
机器之心

AI绘本引发版权与道德争议:企业家用AI完成近千幅插图的字母书

企业家尼尔斯·霍文(Niels Houwen)最近出版了一本儿童字母书,书中近1000幅插图全部由人工智能(AI)生成。 霍文声称,如果由人类艺术家手工完成如此庞大的插画数量,其难度和成本都将高得不切实际。 他估计,整个项目如果人工完成,成本约为5万美元,且每幅插图需要耗时约两小时。
11/10/2025 11:21:30 AM
AI在线

亚马逊推Kindle Translate!免费AI翻译助独立作者出海,文学“灵魂”能否留存引热议

为打破语言壁垒、激活全球阅读市场,亚马逊于本周四正式推出Kindle Translate——一项专为Kindle Direct Publishing(KDP)作者打造的AI翻译服务。 目前该功能处于Beta阶段,完全免费向所有KDP作者开放,初始支持英语与西班牙语互译、德语译英语,未来将逐步扩展语种。 此举直击独立作者长期面临的痛点:高昂的人工翻译成本与稀缺的本地化渠道。
11/10/2025 11:21:30 AM
AI在线

纯手工制作!《绝命毒师》主创新剧拒绝AI参与 称其是全球最贵的抄袭机器

在AI生成内容席卷影视行业的当下,一部新剧用一句简短却锋利的声明划出底线。 苹果TV 最新科幻剧集《Pluribus》在片尾字幕中赫然标注:“本剧由人类制作”(This show was made by humans),紧随其后的是关于动物安全的常规提示——这一刻意并置,将“人类创作”提升至与伦理责任同等重要的地位。 该剧创作者、《绝命毒师》《风骚律师》缔造者文斯·吉利根(Vince Gilligan)更在《Variety》专访中火力全开,直言:“我讨厌AI!”他毫不留情地将生成式AI称为“全球最昂贵、最耗能的抄袭机器”,并讽刺其产出不过是“一头牛在反刍——无休止地吐出废话循环”。
11/10/2025 11:21:27 AM
AI在线

5000万美元种子轮融资!斯坦福教授创立Inception,用“扩散式大模型”挑战GPT-5,代码生成速度超1000 token/秒

当全球AI竞赛仍围绕自回归大模型(如GPT-5、Gemini)激烈缠斗时,一家新锐初创公司正以颠覆性架构悄然突围。 由斯坦福大学教授Stefano Ermon领衔的AI公司Inception近日宣布完成5000万美元种子轮融资,由Menlo Ventures领投,微软M12、英伟达NVentures、Snowflake Ventures、Databricks Investment及Mayfield跟投,吴恩达(Andrew Ng)与Andrej Karpathy亦以天使投资人身份加入,阵容堪称豪华。 Inception的核心押注,是将原本用于图像生成的扩散模型(Diffusion Models)全面引入文本与代码领域,挑战当前主流的自回归范式。
11/10/2025 11:21:27 AM
AI在线

OpenAI 推出 GPT-5-Codex-Mini:更轻、更快、更省的开发者专用模型

OpenAI 近日正式发布 GPT-5-Codex-Mini,这是一款专为开发者打造的高性价比编程模型,继9月推出的 GPT-5-Codex 后,再次拓宽了智能编程的应用边界。 GPT-5-Codex 基于 GPT-5架构,专注提升代码推理与生成能力,能够在真实软件工程任务中执行包括新项目创建、功能扩展、测试编写与大规模代码重构等多类复杂操作。 其在 SWE-bench Verified 基准测试中取得74.5% 的高分,超越此前的 GPT-5High(72.8%),展现出显著性能优势。
11/10/2025 11:21:27 AM
AI在线

具身智能公司无界动力完成3亿元首轮融资,红杉中国、线性资本领投,高瓴创投、地平线等跟投

11月10日,通用具身智能机器人公司无界动力完成首轮3亿元天使融资,由红杉中国、线性资本领投,高瓴创投、地平线、华业天成、钟鼎资本、BV百度风投、同歌创投等跟投,在首次融资中集聚了顶级财务投资机构与多元产业资本的双重认可。 与此同时,天使 轮融资已接近完成,累计融资额超5亿元。 无界动力2025年创立于北京,聚焦于构建机器人“通用大脑”与“操作智能”,突破手、眼、脑协同的关键瓶颈,将具身智能转化为一种可广泛部署、持续进化的基础设施,以通用基础模型研发与通用专家模型落地应用双线驱动,致力于为全球客户提供软硬一体、高可靠性的具身智能解决方案。
11/10/2025 10:19:00 AM
徐咪

小米 HyperAI 荣获 “直通乌镇” 全球互联网大赛特等奖

小米公司通过其官方渠道宣布,Xiaomi HyperAI 在 “直通乌镇” 全球互联网大赛的智能终端领域中获得了特等奖。 这一赛事由国家网信办和浙江省政府联合主办,旨在展示全球互联网技术的创新和发展。 本届大赛吸引了来自29个国家的1082个项目参与,经过多轮评选,最终只有六个项目获得特等奖。
11/10/2025 9:51:43 AM
AI在线

滴滴顺风车推出 AI 监管新措施,严打私下拼车行为

滴滴顺风车正式推出了一项名为 “独享守护” 的智能模型,旨在有效打击私下拼车行为。 这项新技术将通过实时分析车辆行驶轨迹,识别是否存在绕行或异常停留等不规范现象,从而确保乘客的乘车安全。 根据滴滴官方的介绍,该模型能够综合分析司机与乘客之间的沟通、接单数据等信息,全面判断行程是否符合 “独享” 场景。
11/10/2025 9:51:19 AM
AI在线

​阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹,挑战 OpenAI 的领先地位

近日,中国科技巨头阿里巴巴集团发布了升级版的人工智能推理模型 ——Qwen3-Max-Thinking。 该模型在两项全球顶级数学竞赛中取得了满分,展示了其在推理和问题解决方面的强大能力。 这使得 Qwen3-Max-Thinking 成为首个在美国邀请数学考试(AIME)和哈佛 - 麻省理工数学锦标赛(HMMT)中取得100% 准确率的中国 AI 推理模型。
11/10/2025 9:51:18 AM
AI在线

LMArena最新排名:文心大模型5.0文本能力排名第一

在全球人工智能领域,竞争愈发激烈,最新消息显示,文心全新发布的 ERNIE-5.0-Preview-1022 模型在 LMArena 大模型竞技场的最新排名中脱颖而出,成为国内文本能力的冠军,同时在全球范围内并列第二。 这一成绩的取得,标志着中国在大模型技术上的再一次突破,也让人们对人工智能的未来充满期待。 根据 11 月 8 日发布的排名,ERNIE-5.0-Preview-1022 在创意写作、复杂长问题理解以及指令遵循等多个领域展现出卓越的性能,尤其在处理复杂的语言任务时,表现更是优于多款国际知名模型,包括 gpt-5-high。
11/10/2025 9:51:16 AM
AI在线

​研究显示:英国四分之一大企业将因 AI 削减员工

根据最新的研究调查,预计未来一年内,约四分之一的大型英国企业将会因人工智能(AI)的发展而削减员工。 这项调查特别关注了企业的用人结构,显示出初级职位受到的影响尤为明显。 图源备注:图片由AI生成,图片授权服务商Midjourney在这项调查中,参与的企业主表示,随着 AI 技术的普及和应用,许多传统的初级岗位面临着被自动化取代的风险。
11/10/2025 9:51:05 AM
AI在线

月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能登顶人类终极考试

国产大模型再放“王炸”。 月之暗面(Moonshot AI)于本周四正式开源其迄今最强的思考型大模型——Kimi K2Thinking,不仅在权威基准“人类终极考试”(HLE)中以44.9%的得分力压GPT-5、Grok-4、Claude4.5等国际闭源巨头,更以仅460万美元(约合3277万元人民币)的训练成本,掀起一场高性价比AI革命。 这一成绩尤为震撼之处在于其极致的成本控制。
11/10/2025 9:51:03 AM
AI在线