资讯列表
首个多模态 AI 可用的临床试验预测数据集平台,香港科技大学(广州)陈晋泰、南京大学符天凡等团队发布TrialBench
作者 | 论文团队编辑 | ScienceAI「临床试验是新药从实验室走向患者的关键桥梁,但其失败率高、周期长、成本巨大。 我们希望借助人工智能重塑这条桥梁。 」在制药与医学研究的世界里,临床试验是一项极其核心但也极其困难的工作:跨越多个阶段,耗时往往超过十年,平均成本可能高达数十亿美元,且成功率通常不足 15%。
10/2/2025 3:12:00 PM
ScienceAI
小红书发布FireRedChat:首个可私有化部署的全双工大模型语音交互系统
小红书智创音频团队推出业内首个支持私有化部署的全双工大模型语音交互系统 FireRedChat,自研流式 pVAD 与 EoT 让语音交互更加自然,首发级联与半级联两套实现,端到端时延逼近工业级应用。 彻底开源、可私域落地,打造真正 “知冷暖、能共情、懂表达” 的语音 AI。 小红书智创音频团队发布 FireRedChat—— 业内首个支持私有化部署的全双工大模型语音交互系统,直击延迟高、噪声敏感、可控性差、依赖外部 API 等痛点。
10/2/2025 3:07:00 PM
机器之心
梦里啥都有?谷歌新世界模型纯靠「想象」训练,学会了在《我的世界》里挖钻石
只让机器人或虚拟智能体「想象」,不让它们和物理世界交互,它们也能学到和世界交互的技能? 谷歌的世界模型 Dreamer 4 为这一想法提供了新的支撑。 为了在具身环境中解决复杂任务,智能体需要深入理解世界并选择成功的行动。
10/2/2025 3:00:00 PM
机器之心
Sora 2干翻Veo 3?超全对比实测:会中文脱口秀,但体操翻车,附有效邀请码
这次,OpenAI 又搞了波大的,祭出 Sora2,可以直接生成最长 20 秒的 1080p 视频。 比如,有网友拿奥特曼生成了 GPU 外卖小哥,甚至还有去超市偷显卡的剧情。 相比于旧版本,Sora 2 在物理准确性、真实感和可控性方面都更胜一筹,而且它还和谷歌 Veo3 一样具备音画同步能力。
10/1/2025 8:17:00 PM
机器之心
Sora 2深夜来袭,OpenAI直接推出App,视频ChatGPT时刻到了
没想到吧,在别家节前卷大模型时,OpenAI 悄悄发布了 Sora2。 而且,这次是直接产品化,推出了 App,甚至还有配套的视频推送算法,声称可以防成瘾。 这是要做自己的 TikTok?
10/1/2025 11:01:00 AM
机器之心
CUDA内核之神、全球最强GPU程序员?OpenAI的这位幕后大神是谁
在 AI 圈里,聚光灯总是追逐着那些履历光鲜的明星人物。 但一个伟大的团队,不仅有台前的明星,更有无数在幕后贡献关键力量的英雄。 之前我们介绍了 OpenAI 的两位波兰工程师,最近 OpenAI 又一位身处幕后的工程师成为了焦点。
10/1/2025 10:55:00 AM
机器之心
复旦、同济和港中文等重磅发布:强化学习在大语言模型全周期的全面综述
近年来,以强化学习为核心的训练方法显著提升了大语言模型(Large Language Models, LLMs)的推理能力与对齐性能,尤其在理解人类意图、遵循用户指令以及增强推理能力方面效果突出。 尽管现有综述对强化学习增强型 LLMs 进行了概述,但其涵盖范围较为有限,未能全面总结强化学习在 LLMs 全生命周期中的作用机制。 对此,来自复旦大学、同济大学、兰卡斯特大学以及香港中文大学 MM Lab 等顶尖科研机构的研究者们全面总结了大语言模型全生命周期的最新强化学习研究,完成题为 “Reinforcement Learning Meets Large Language Models: A Survey of Advancements and Applications Across the LLM Lifecycle” 的长文综述,系统性回顾了领域最新进展,深入探讨研究挑战并展望未来发展方向。
10/1/2025 10:51:00 AM
机器之心
Thinking Machines又发高质量博客:力推LoRA,不输全量微调
LoRA 在绝大多数后训练场景下,能以远低于全量微调的成本,获得几乎同等的效果。 Thinking Machines 将这一现象形容为 LoRA 的低遗憾区间(low-regret region)——即便不用全量微调,选择 LoRA 也不会让人后悔。 最近,Thinking Machines 真实高产啊。
9/30/2025 7:21:00 PM
机器之心
节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世
新一代大模型的发布,都赶在了国庆假期前。 昨天,深度求索刚刚开源 DeepSeek-V3.2-Exp。 今天,另一国产大模型之光智谱 AI 也正式发布了旗下新一代旗舰模型 GLM-4.6,刚好撞车 Claude Sonnet 4.5。
9/30/2025 7:16:00 PM
机器之心
CAIR开源发布超声基座大模型EchoCare“聆音”,10余项医学任务性能登顶
2025年9月17日,中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型(简称“聆音”)。 该模型基于超过450万张、涵盖50多个人体器官的大规模超声影像数据集训练而成,在器官识别、器官分割、病灶分类等10余项典型超声医学任务测试中表现卓越,性能全面登顶。 同时,“聆音”已在山东大学齐鲁医院、中南大学湘雅医院、香港中文大学医学院的多个超声检查领域完成3000多例临床回溯性验证,与当前SOTA(最优)模型相比,性能平均提高3%~5%。
9/30/2025 7:07:00 PM
机器之心
NeurIPS 2025 Spotlight | FSDrive统一VLA和世界模型,推动自动驾驶迈向视觉推理
面向自动驾驶的多模态大模型在 “推理链” 上多以文字或符号为中介,易造成空间 - 时间关系模糊与细粒度信息丢失。 FSDrive(FutureSightDrive)提出 “时空视觉 CoT”(Spatio-Temporal Chain-of-Thought),让模型直接 “以图思考”,用统一的未来图像帧作为中间推理步骤,联合未来场景与感知结果进行可视化推理。 该方法在不改动原有 MLLM 架构的前提下,通过 “词表扩展 自回归视觉生成” 激活图像生成能力,并以 “由易到难” 的渐进式视觉 CoT 注入物理先验。
9/30/2025 7:03:00 PM
机器之心
以赛促创新,推动具身智能机器人“真干活”,2025年第二届中关村具身智能机器人应用大赛火热报名中
在人形机器人与具身智能技术浪潮以迅猛之势席卷全球的当下,人形机器人如何落地成为社会关注的焦点。 9月以来,诸多聚焦落地的人形机器人订单接连达成,似乎为这一难题提供了解决方案,银河通用机器人经营的无人超市“银河太空舱”开张,该零售店成为商业场景下全球首个面向消费者常态化经营的具身智能落地场景;加速进化也宣布从球场走向家庭,将推出面向极客和教育场景的消费级机器人;优必选签署2.5亿元具身智能人形机器人产品及解决方案采购合同,直击工业场景的痛点需求;智平方与慧智物联达成战略合作,在未来三年内将部署超1000台具身智能机器人,覆盖从仓储物流、上下物料、零部件装配到质检测试等全流程;众擎机器人与多伦科技签署战略合作协议,计划在未来三年内采购不低于2000台具身智能人形机器人用于重点领域场景落地;星尘智能与仙工智能达成人形机器人千台级订单战略合作,预计在未来两年内推动上千台AI机器人在工业、制造、仓储、物流等场景大规模、分阶段部署。 这些商业化订单无疑揭示了人形机器人火热的现状,那么还有哪些真实场景人形机器人还有表现机会?
9/30/2025 10:39:00 AM
新闻助手
Claude Sonnet 4.5来了!能连续编程30多小时、1.1万行代码
十一假期还没开始,大模型又开始卷起来了! 昨天,DeepSeek 开源新模型 V3.2-Exp,深夜 Anthropic 也不甘人后,重磅发布 Claude Sonnet 4.5。 作为编程领域的王者,Claude 新模型依然强势,自称为世界上最好的编码模型。
9/30/2025 10:32:00 AM
机器之心
LLM工业级自进化:北邮与腾讯AI Lab提出MoE-CL架构,解决大模型持续学习核心痛点
在工业级大语言模型(LLM)应用中,动态适配任务与保留既有能力的 “自进化” 需求日益迫切。 真实场景中,不同领域语言模式差异显著,LLM 需在学习新场景合规规则的同时,不丢失旧场景的判断能力。 这正是大模型自进化核心诉求,即 “自主优化跨任务知识整合,适应动态环境而无需大量外部干预”。
9/30/2025 10:26:00 AM
机器之心
华为CloudMatrix384超节点支持DeepSeek-V3.2-Exp:第一时间上线
9 月 29 日,DeepSeek 发布并开源了最新一代大语言模型 DeepSeek-V3.2-Exp,引发了全网关注。 该模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。 与此同时,国内 AI 算力厂商也宣布对新模型实现了适配。
9/29/2025 11:21:00 PM
新闻助手
强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码
机器之心报道机器之心编辑部2025 年 9 月 29 日,深度求索公司发布新一代模型架构 DeepSeek-V3.2 ,引发行业广泛关注。 令人瞩目的是,在该大模型发布的同时,寒武纪也官宣了对 DeepSeek-V3.2 的适配,并开源大模型推理引擎 vLLM 源代码。 深度求索公司正式发布的 DeepSeek-V3.2-Exp 模型,是一个实验性(Experimental)的版本。
9/29/2025 7:17:00 PM
机器之心
刚刚,DeepSeek开源V3.2-Exp,公开新稀疏注意力机制DSA
还是熟悉的节奏! 在假期前一天,DeepSeek 果然搞事了。 刚刚,DeepSeek-V3.2-Exp 开源了!
9/29/2025 6:36:00 PM
机器之心
SALMONN 系列音视频理解大模型霸榜回归!推理增强、高帧率、无文本泄漏全线突破
SALMONN 家族在首个通用音频理解模型(ICLR 2024)和首个全要素音视频理解模型 video-SALMONN(ICML 2024)基础上再次迎来重磅扩容,霸榜各大音视频理解榜单! 全新一代 video-SALMONN 2/2 、首个开源推理增强型音视频理解大模型 video-SALMONN-o1(ICML 2025)、首个高帧率视频理解大模型 F-16(ICML 2025),以及无文本泄漏基准测试 AVUT(EMNLP 2025) 正式发布。 新阵容在视频理解能力与评测体系全线突破,全面巩固 SALMONN 家族在开源音视频理解大模型赛道的领先地位。
9/29/2025 3:20:00 PM
机器之心