AI在线 AI在线

资讯列表

NeurIPS 2025 | ARGRE框架实现高效LLM解毒:自回归奖励引导,安全对齐更快、更准、更轻

作者为北京航空航天大学的肖宜松,刘艾杉,应宗浩,刘祥龙,新加坡国立大学的梁思源,新加坡南洋理工大学的陶大程。 本文已被 NeurIPS 2025 录用。 LLM 已在智能创作、企业服务等领域广泛应用,但其内容安全问题仍是落地过程中的关键挑战。
10/25/2025 10:54:00 PM
机器之心

「我受够了Transformer」:其作者Llion Jones称AI领域已僵化,正错失下一个突破

这两天,VentureBeat 一篇报道在 Hacker News 上引发热议。 颠覆性论文《Attention is all you need》的作者之一,现任 Sakana AI CTO 的 Llion Jones 在近日的 TED AI 大会上表示他已经厌倦了 Transformer。 是什么,让这位 Transformer 的创造者发出了如此言论?
10/25/2025 10:51:00 PM
机器之心

让VLM学会「心中有世界」:VAGEN用多轮RL把视觉智能变成「世界模型」推理机器

当今的 AI 智能体(Agent)越来越强大,尤其是像 VLM(视觉-语言模型)这样能「看懂」世界的智能体。 但研究者发现一个大问题:相比于只处理文本的 LLM 智能体,VLM 智能体在面对复杂的视觉任务时,常常表现得像一个「莽撞的执行者」,而不是一个「深思熟虑的思考者」。 它们为什么会这样?
10/25/2025 10:46:00 PM
机器之心

2025谷歌博士生奖学金揭晓,清华、科大、南大等校友入选

他们是正在塑造技术格局的人。 本周四,谷歌公布了 2025 年度的博士奖学金入围名单。 谷歌于 2009 年创建了博士奖学金计划(Google PhD Fellows),以表彰和支持在计算机科学及相关领域进行杰出研究的优秀研究生,培养专注于关键基础科学的下一代科学家。
10/25/2025 10:38:00 PM
机器之心

快手Klear团队提出CE-GPPO:通过梯度保留协调熵,解决强化学习中的熵不稳定问题

本研究由快手科技 Klear 语言大模型团队完成,核心作者苏振鹏,潘雷宇,吕民轩,胡文凭,张富峥,周国睿等。 快手 Klear 语言大模型团队聚焦在基础语言大模型研发、Agent RL 等前沿技术创新等方向,积累务实的探索 AGI 的能力边界,并不断推进 AI 领域新技术和新产品的发展。 此前,该团队已开源了 Klear-46B-A2.5B 和 Klear-Reasoner-8B 等模型,其中 Klear-Reasoner-8B 在数学和代码的基准测试上达到了同参数级别模型的 SOTA 效果。
10/25/2025 10:29:00 PM
机器之心

开源模型首次物理奥赛夺金!上海AI Lab 235B模型击败GPT5和Grok4

P1团队 投稿量子位 | 公众号 QbitAI开源模型首次在国际物理奥林匹克竞赛夺金了。 来自上海AI Lab的P1-235B-A22B取得了21.2分的成绩,成功跨越金牌线。 在覆盖2024-2025年全球13场顶级物理竞赛的HiPhO基准测试中,P1-235B-A22B获12金1银,与谷歌Gemini-2.5-Pro并列奖牌榜第一。
10/25/2025 2:48:12 PM
梦晨

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity

作者 | 论文团队编辑 | ScienceAI2025 年 10 月,一篇题为《Hierarchical affinity landscape navigation through learning a shared pocket-ligand space》的论文,作为封面文章发表于 Cell 旗下期刊《Patterns》。 该研究由粤港澳大湾区数字经济研究院(IDEA)AI4Science 团队、晶泰科技(XtalPi)及华盛顿大学的研究团队联合攻关,成功开发了名为 LigUnity 的亲和力基础模型。 论文地址:(25)00219-3?_returnURL=::,更是一次范式级的革新 —— 它通过构建蛋白质与配体的共享表示空间,让 AI 统一学习并驾驭从大规模筛选到精细活性优化的完整药物发现流程。
10/24/2025 10:22:00 PM
ScienceAI

AI科研走进课堂,海光信息×紫东太初共建「人工智能实训基地」

编辑 | ScienceAI近日,柳州城市职业学院人工智能订单班正式开班,海光信息联合紫东太初为该校打造出首个人工智能实训基地,以「国产芯片 国产大模型」的强强组合,赋能 AI 科研走进高校课堂。 作为中科院自动化研究所研发的跨模态通用人工智能平台,紫东太初与海光信息「师出同门」,既是国内唯一的多模态大模型国家队,也是全球第一个中文多模态大模型。 目前,紫东太初大模型已与海光芯片完成深度适配,具备强大的全栈国产化基础软硬件支撑。
10/24/2025 10:18:00 PM
ScienceAI

第300台极狐阿尔法T5无人车下线,小马智行冲刺千台Robotaxi车队

近日,第300台由小马智行与北汽新能源联合打造的极狐阿尔法T5 Robotaxi宣告下线,这是小马智行冲刺千台规模Robotaxi车队的里程碑。 据悉,极狐阿尔法T5 Robotaxi于今年7月启动量产,搭载小马智行第七代自动驾驶量产方案,具备全天候、全场景、全时段的自动驾驶能力。 在2025世界智能汽车大会期间,小马智行和北汽集团携手首次将极狐阿尔法T5 Robotaxi车型带到WICV大会现场,收获众多国家机构、国内外行业专家的关注和高度认可。
10/24/2025 9:04:17 PM
一凡

零代码也能当"导演"!智元推出机器人内容创作平台"灵创"

程序员节当日,智元机器人(18.670,0.40,2.19%)重磅推出首个零代码、零门槛的人形机器人内容创作平台——"灵创",旨在让普通用户无需编程基础即可成为机器人的"导演"。 "灵创"平台以"让创作更简单,让表达更灵动"为核心理念,首次将AI动作捕捉、云端模仿学习与多模态编排能力深度融合。 用户只需上传一段人类动作视频,无需专业设备,即可实现从真人表演到机器人精准复刻的端到端转化,轻松打造属于自己的机器人表演作品。
10/24/2025 6:06:07 PM
AI在线

微软AI主管苏莱曼:微软不会开发情色类AI,与OpenAI划清界限

据 CNBC 报道,微软 AI 业务首席执行官 穆斯塔法·苏莱曼(Mustafa Suleyman) 周四在加州门洛帕克举行的佩利国际理事会峰会上明确表示,微软不会开发情色类 AI 服务,并强调“这绝非我们打算提供的服务”,显示出公司在生成式 AI 伦理边界上的明确立场。 这一表态正值微软长期合作伙伴 OpenAI 公开表示将允许经过验证的成年人在 ChatGPT 上创作情色内容后一周。 OpenAI 首席执行官 萨姆·奥特曼(Sam Altman) 当时表示,公司“并非世界的道德裁判”,这一决定在业内引发了广泛讨论与争议。
10/24/2025 6:06:07 PM
AI在线

脑机接口产业化加速:中国市场规模 2027 年将达55. 8 亿元

据央视财经今日报道,正值秋季招聘季,作为国家重点发展的未来产业之一,脑机接口技术正从实验室阶段加速迈向产业化落地。 这一前沿领域融合了生物医学、神经科学、计算机科学和电子工程等多学科技术,正成为高校毕业生新的就业增长点。 数据显示,预计到2027年,中国脑机接口市场规模将达到55.8亿元,年均增长率约为20%。
10/24/2025 6:06:05 PM
AI在线

SEE Conf 2025:开启体验科技的新十年

『We believe 产品体验的提升能助⼒业务增⻓』SEE Conf 2019 · 《科技与⼈⽂结合的体验度量》『一切精彩才刚刚开始,体验科技大会,今年是第三届,我相信至少能持续举办三十届。 现在参会主体是八零后、九零后,期待二十多年后,体验科技大会里,不仅依旧能看见八零后、九零后和零零后,还能看见大量一零后和二零后。 』SEE Conf 2020 · 《体验科技和好的产品》.
10/24/2025 5:40:11 PM
一水

教全世界与AI对话的男人,正式加入DeepMind!提示工程封神

全球最牛的提示工程师Riley Goodside,官宣入职谷歌DeepMind了。 Riley前后斟酌了两个月的时间,才拿下了这个决定。 2022年ChatGPT诞生之后,他仅凭和AI聊天,就能年入百万美金,引起全网关注。
10/24/2025 5:36:17 PM

智能体系统如何「边做边学」?斯坦福团队探索在线优化的新范式

如何让智能体进行复杂推理与工具调用? 传统方法主要有两类:训练单一的大语言模型,使其同时承担思考与工具调用的任务;要么依赖静态提示词驱动的 training-free 智能体系统。 然而,前者在长链推理、工具多样化与动态环境反馈下训练常变得不稳定,缺乏可扩展性(scalability);后者则缺少学习与适应能力,难以应对复杂场景。
10/24/2025 5:27:00 PM
机器之心

FM Agent登顶OpenAI MLE-Bench,由百度智能云研发

近日,百度智能云研发的FM Agent登顶OpenAI机器学习工程权威基准MLE-Bench,拿下SOTA成绩,超越微软R&D Agent和OpenAI展示的AIDE系统。 据了解,MLE-Bench由OpenAI主导,是目前评估AI Agent“实战”能力的核心榜单。 该基准含金量极高,其测试集包含了75个真实的Kaggle竞赛项目——这些项目均为往年全球顶尖数据科学家团队参与解决的真实工程难题,测试AI在模型训练、数据准备、实验运行等机器学习工程中的能力。
10/24/2025 5:25:38 PM
一水

“小米汽车SOS 1秒接通,不含排队时间”,高管回应了

杰西卡 发自 副驾寺. 智能车参考 | 公众号 AI4Auto依旧是开局一张图:“小米汽车SOS紧急呼叫,1秒接通。 ” 但前提是,“不含排队时间”。
10/24/2025 4:56:13 PM
杰西卡

如何把ChatGPT嵌入到自己的应用中?

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)10月初,OpenAI 的 AgentKit 来得猝不及防! 作为一款面向开发者的全能工具包,能让 ChatGPT 驱动的智能体被嵌入到任何网站或应用中。 它首次亮相于 OpenAI 2025 年 DevDay,目标是让 AI 不止会“聊天”,还能执行动作——比如浏览网页、调用 API、完成多步任务。
10/24/2025 4:48:06 PM
云昭