资讯列表

分类

标签

3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化

近期，阿里巴巴 ROLL 团队（淘天未来生活实验室与阿里巴巴智能引擎团队）联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构（Asynchronous Training）、Asymmetric PPO（AsyPPO）与 Attention 机制（Attention-based Reasoning Rhythm），「3A」彼此间并非孤立的技术堆砌，而是深度耦合，致力于共同推动「强化学习用于大语言模型（RL4LLM）」迈向高效、精细与可解释的新范式。具体来看，ROLL Flash 以解耦为核心，通过「细粒度并行」与「采样 - 训练解耦」两大原则，将生成、环境交互、奖励计算与模型训练彻底流水线化，实现全链路异步执行，显著提升 GPU 利用率，同时通过「异步比」机制保障训练稳定性，集成主流 Off-policy 算法等，使得异步训练效果能与同步训练相媲美。算法架构层面，AsyPPO 首次系统论证了评论家的参数规模与其价值估计能力并无必然关联，仅需两个小型评论家，即可在显著降低计算资源消耗的同时，提升推理性能与训练鲁棒性。

11/10/2025 1:36:00 PM

机器之心

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

在 NeurIPS 2025 论文中，来自南京理工大学、中南大学、南京林业大学的研究团队提出了一个极具突破性的框架 ——VIST（Vision-centric Token Compression in LLM），为大语言模型的长文本高效推理提供了全新的 “视觉解决方案”。值得注意的是，这一思路与近期引起广泛关注的 DeepSeek-OCR 的核心理念不谋而合。研究背景在处理短文本时，大语言模型（LLM）已经表现出惊人的理解和生成能力。

11/10/2025 1:19:00 PM

机器之心

2025宝山・智能机器人产业大会暨嘉年华启动在即

当 AI 大潮席卷全球，智能机器人产业正站在发展的关键节点 —— 未来发展方向何在？产业要素如何协同？全要素、全产业链的生态如何构建？

11/10/2025 1:12:00 PM

机器之心

NeurIPS2025 Spotlight | RobustMerge: 多模态大模型高效微调模型合并的全新范式

在 AI 技术飞速发展的今天，如何高效地将多个专业模型的能力融合到一个通用模型中，是当前大模型应用面临的关键挑战。全量微调领域已经有许多开创性的工作，但是在高效微调领域，尚未有对模型合并范式清晰的指引。因此，中科院、中山大学、北京大学的研究团队针对高效微调模型合并，提出了「方向鲁棒性」的概念，首次揭示了参数高效微调（PEFT）模块合并失败的根本原因是「方向不鲁棒」，而非传统认为的「符号冲突」，并提供了一个简单高效、无需额外成本的解决方案（RobustMerge）。

11/10/2025 1:08:00 PM

机器之心

谢赛宁、李飞飞、LeCun联手提出多模态LLM新范式，「空间超感知」登场

纽约大学助理教授谢赛宁新作又来了，合著者还有李飞飞、Yann LeCun。这次的成果名为「Cambrian-S」，根据谢赛宁的说法，它既是一种观点，也是一个数据集、一个基准或者一个模型，代表其迈出了探索视频空间超感知的第一步。从名称上来看，Cambrian-S 是谢赛宁团队去年研究成果「Cambrian-1」的延续。

11/10/2025 1:00:00 PM

机器之心

MeshCoder：以大语言模型驱动，从点云到可编辑结构化物体代码的革新

生成式 AI 的浪潮赋予了机器无尽的创造力，我们已亲眼见证它在文字与图像世界 “点石成金” 的魔力。然而，当这股浪潮涌向更复杂的三维空间，挑战也随之升级。过去的 3D 生成 AI 如孩童堆积木，成果粗糙模糊；如今，它渴望成长为一名 “数字建筑师”，去建造结构精巧、可被编辑改造的虚拟世界。

11/10/2025 12:01:00 PM

机器之心

AI绘本引发版权与道德争议:企业家用AI完成近千幅插图的字母书

企业家尼尔斯·霍文（Niels Houwen）最近出版了一本儿童字母书，书中近1000幅插图全部由人工智能（AI）生成。霍文声称，如果由人类艺术家手工完成如此庞大的插画数量，其难度和成本都将高得不切实际。他估计，整个项目如果人工完成，成本约为5万美元，且每幅插图需要耗时约两小时。

11/10/2025 11:21:30 AM

AI在线

亚马逊推Kindle Translate！免费AI翻译助独立作者出海，文学“灵魂”能否留存引热议

为打破语言壁垒、激活全球阅读市场，亚马逊于本周四正式推出Kindle Translate——一项专为Kindle Direct Publishing（KDP）作者打造的AI翻译服务。目前该功能处于Beta阶段，完全免费向所有KDP作者开放，初始支持英语与西班牙语互译、德语译英语，未来将逐步扩展语种。此举直击独立作者长期面临的痛点:高昂的人工翻译成本与稀缺的本地化渠道。

11/10/2025 11:21:30 AM

AI在线

纯手工制作！《绝命毒师》主创新剧拒绝AI参与称其是全球最贵的抄袭机器

在AI生成内容席卷影视行业的当下，一部新剧用一句简短却锋利的声明划出底线。苹果TV 最新科幻剧集《Pluribus》在片尾字幕中赫然标注:“本剧由人类制作”（This show was made by humans），紧随其后的是关于动物安全的常规提示——这一刻意并置，将“人类创作”提升至与伦理责任同等重要的地位。该剧创作者、《绝命毒师》《风骚律师》缔造者文斯·吉利根（Vince Gilligan）更在《Variety》专访中火力全开，直言:“我讨厌AI!”他毫不留情地将生成式AI称为“全球最昂贵、最耗能的抄袭机器”，并讽刺其产出不过是“一头牛在反刍——无休止地吐出废话循环”。

11/10/2025 11:21:27 AM

AI在线

5000万美元种子轮融资！斯坦福教授创立Inception，用“扩散式大模型”挑战GPT-5，代码生成速度超1000 token/秒

当全球AI竞赛仍围绕自回归大模型（如GPT-5、Gemini）激烈缠斗时，一家新锐初创公司正以颠覆性架构悄然突围。由斯坦福大学教授Stefano Ermon领衔的AI公司Inception近日宣布完成5000万美元种子轮融资，由Menlo Ventures领投，微软M12、英伟达NVentures、Snowflake Ventures、Databricks Investment及Mayfield跟投，吴恩达(Andrew Ng)与Andrej Karpathy亦以天使投资人身份加入，阵容堪称豪华。 Inception的核心押注，是将原本用于图像生成的扩散模型（Diffusion Models）全面引入文本与代码领域，挑战当前主流的自回归范式。

11/10/2025 11:21:27 AM

AI在线

OpenAI 推出 GPT-5-Codex-Mini:更轻、更快、更省的开发者专用模型

OpenAI 近日正式发布 GPT-5-Codex-Mini，这是一款专为开发者打造的高性价比编程模型，继9月推出的 GPT-5-Codex 后，再次拓宽了智能编程的应用边界。 GPT-5-Codex 基于 GPT-5架构，专注提升代码推理与生成能力，能够在真实软件工程任务中执行包括新项目创建、功能扩展、测试编写与大规模代码重构等多类复杂操作。其在 SWE-bench Verified 基准测试中取得74.5% 的高分，超越此前的 GPT-5High（72.8%），展现出显著性能优势。

11/10/2025 11:21:27 AM

AI在线

具身智能公司无界动力完成3亿元首轮融资，红杉中国、线性资本领投，高瓴创投、地平线等跟投

11月10日，通用具身智能机器人公司无界动力完成首轮3亿元天使融资，由红杉中国、线性资本领投，高瓴创投、地平线、华业天成、钟鼎资本、BV百度风投、同歌创投等跟投，在首次融资中集聚了顶级财务投资机构与多元产业资本的双重认可。与此同时，天使轮融资已接近完成，累计融资额超5亿元。无界动力2025年创立于北京，聚焦于构建机器人“通用大脑”与“操作智能”，突破手、眼、脑协同的关键瓶颈，将具身智能转化为一种可广泛部署、持续进化的基础设施，以通用基础模型研发与通用专家模型落地应用双线驱动，致力于为全球客户提供软硬一体、高可靠性的具身智能解决方案。

11/10/2025 10:19:00 AM

徐咪

小米 HyperAI 荣获 “直通乌镇” 全球互联网大赛特等奖

小米公司通过其官方渠道宣布，Xiaomi HyperAI 在 “直通乌镇” 全球互联网大赛的智能终端领域中获得了特等奖。这一赛事由国家网信办和浙江省政府联合主办，旨在展示全球互联网技术的创新和发展。本届大赛吸引了来自29个国家的1082个项目参与，经过多轮评选，最终只有六个项目获得特等奖。

11/10/2025 9:51:43 AM

AI在线

滴滴顺风车推出 AI 监管新措施，严打私下拼车行为

滴滴顺风车正式推出了一项名为 “独享守护” 的智能模型，旨在有效打击私下拼车行为。这项新技术将通过实时分析车辆行驶轨迹，识别是否存在绕行或异常停留等不规范现象，从而确保乘客的乘车安全。根据滴滴官方的介绍，该模型能够综合分析司机与乘客之间的沟通、接单数据等信息，全面判断行程是否符合 “独享” 场景。

11/10/2025 9:51:19 AM

AI在线

阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹，挑战 OpenAI 的领先地位

近日，中国科技巨头阿里巴巴集团发布了升级版的人工智能推理模型 ——Qwen3-Max-Thinking。该模型在两项全球顶级数学竞赛中取得了满分，展示了其在推理和问题解决方面的强大能力。这使得 Qwen3-Max-Thinking 成为首个在美国邀请数学考试（AIME）和哈佛 - 麻省理工数学锦标赛(HMMT)中取得100% 准确率的中国 AI 推理模型。

11/10/2025 9:51:18 AM

AI在线

LMArena最新排名：文心大模型5.0文本能力排名第一

在全球人工智能领域，竞争愈发激烈，最新消息显示，文心全新发布的 ERNIE-5.0-Preview-1022 模型在 LMArena 大模型竞技场的最新排名中脱颖而出，成为国内文本能力的冠军，同时在全球范围内并列第二。这一成绩的取得，标志着中国在大模型技术上的再一次突破，也让人们对人工智能的未来充满期待。根据 11 月 8 日发布的排名，ERNIE-5.0-Preview-1022 在创意写作、复杂长问题理解以及指令遵循等多个领域展现出卓越的性能，尤其在处理复杂的语言任务时，表现更是优于多款国际知名模型，包括 gpt-5-high。

11/10/2025 9:51:16 AM

AI在线

研究显示：英国四分之一大企业将因 AI 削减员工

根据最新的研究调查，预计未来一年内，约四分之一的大型英国企业将会因人工智能（AI）的发展而削减员工。这项调查特别关注了企业的用人结构，显示出初级职位受到的影响尤为明显。图源备注：图片由AI生成，图片授权服务商Midjourney在这项调查中，参与的企业主表示，随着 AI 技术的普及和应用，许多传统的初级岗位面临着被自动化取代的风险。

11/10/2025 9:51:05 AM

AI在线

月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元，性能登顶人类终极考试

国产大模型再放“王炸”。月之暗面（Moonshot AI）于本周四正式开源其迄今最强的思考型大模型——Kimi K2Thinking，不仅在权威基准“人类终极考试”(HLE)中以44.9%的得分力压GPT-5、Grok-4、Claude4.5等国际闭源巨头，更以仅460万美元(约合3277万元人民币)的训练成本，掀起一场高性价比AI革命。这一成绩尤为震撼之处在于其极致的成本控制。

11/10/2025 9:51:03 AM

AI在线

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

资讯列表

3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

2025宝山・智能机器人产业大会暨嘉年华启动在即

NeurIPS2025 Spotlight | RobustMerge: 多模态大模型高效微调模型合并的全新范式

谢赛宁、李飞飞、LeCun联手提出多模态LLM新范式，「空间超感知」登场

MeshCoder：以大语言模型驱动，从点云到可编辑结构化物体代码的革新

AI绘本引发版权与道德争议:企业家用AI完成近千幅插图的字母书

亚马逊推Kindle Translate！免费AI翻译助独立作者出海，文学“灵魂”能否留存引热议

纯手工制作！《绝命毒师》主创新剧拒绝AI参与 称其是全球最贵的抄袭机器

5000万美元种子轮融资！斯坦福教授创立Inception，用“扩散式大模型”挑战GPT-5，代码生成速度超1000 token/秒

OpenAI 推出 GPT-5-Codex-Mini:更轻、更快、更省的开发者专用模型

具身智能公司无界动力完成3亿元首轮融资，红杉中国、线性资本领投，高瓴创投、地平线等跟投

小米 HyperAI 荣获 “直通乌镇” 全球互联网大赛特等奖

滴滴顺风车推出 AI 监管新措施，严打私下拼车行为

​阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹，挑战 OpenAI 的领先地位

LMArena最新排名：文心大模型5.0文本能力排名第一

​研究显示：英国四分之一大企业将因 AI 削减员工

月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元，性能登顶人类终极考试

纯手工制作！《绝命毒师》主创新剧拒绝AI参与称其是全球最贵的抄袭机器

阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹，挑战 OpenAI 的领先地位

研究显示：英国四分之一大企业将因 AI 削减员工