资讯列表
首个零样本跨本体泛化开源具身模型:智源RoboBrain-X0 技术细节全解析
为具身智能行业提供了一个可复用、可扩展的通用基座,同时开源训练数据集。 今天,北京智源人工智能研究院(BAAI)正式开源 RoboBrain-X0,一个能够在零样本泛化、轻量微调条件下,驱动多种不同真实机器人完成复杂任务的具身智能基座大模型。 其核心突破在于:用统一的动作空间与分层任务拆解,实现了「一个基座模型,N种身体」,为通用具身智能提供一条切实可行的路径。
9/29/2025 3:11:00 PM
机器之心
腾讯混元3D-Omni:3D版ControlNet突破多模态控制,实现高精度3D资产生成
近年来,3D 原生生成模型在游戏、影视和设计领域的资产创建中展现出强大潜力。 然而,大多数现有方法仍主要依赖图像作为条件输入,缺乏细粒度、多模态的控制能力,限制了其在实际生产流程中的应用。 为解决这一瓶颈,腾讯混元团队推出了混元 3D-Omni,一个基于 Hunyuan3D 2.1 构建的统一多模态可控 3D 生成框架。
9/29/2025 3:05:00 PM
机器之心
云栖大会丨奇富科技费浩峻深度解构金融大模型四步破局路径
9月25日,在云栖大会“新‘模’力 新点金:金融大模型技术峰会”上,奇富科技首席算法科学家费浩峻基于公司丰富的落地实践经验,系统阐述了金融大模型的落地逻辑——告别参数规模的盲目追逐,以“做小做强”的路径推动金融AI从“堆人力、堆模型”的传统范式,迈向“聚智能、见个体”的价值升级,为行业提供了金融大模型务实落地的清晰样本。 费浩峻指出,在传统机器学习阶段,金融AI面临两大核心制约:一是高度依赖人工特征工程,模型难以直接处理真实世界中复杂、非结构化的数据;二是模型泛化能力差,不同业务需定制不同模型,迭代成本高、响应慢。 面对这些挑战,奇富科技围绕金融大模型技术形成四大破局点:第一步,一模型多能,打破泛化瓶颈。
9/29/2025 3:05:00 PM
新闻助手
GPT-5解决量子版NP难题?半小时内给出有效方案
编辑丨%量子计算听起来就很烧脑了,但在理论世界里还有一群人,他们专门研究「量子证明」能做到什么程度。 这个领域叫量子复杂性理论,其中很出名的一个类是 QMA ——它是「量子版的NP问题」,可以理解成:有一个「量子证明」,由验证者用量子计算机来检查真假。 过去二十年,研究者不断尝试把验证错误率压得越来越低,就像玩游戏要刷「满暴击率」。
9/29/2025 2:04:00 PM
ScienceAI
在具身智能的岔路口,这场论坛把数据、模型、Infra聊透了
当机器人成为各大科技展会最受瞩目的焦点,当具身智能论坛场场爆满、一票难求,我们不难发现:这个领域正在经历前所未有的关注热潮。 然而,热潮之下,仍有诸多关键议题悬而未决:面对数据稀缺,有人寄希望于合成数据的突破,有人坚持真机数据才是根本;在技术路线之争中,有人押注端到端的整体范式,有人则认为分层架构更符合演进规律;至于模型形态,有人视 VLA 为智能的最终归宿,也有人认为世界模型才是真正的未来。 现阶段出现这种分歧非常正常,因为整个行业的发展路径尚未收敛。
9/29/2025 11:40:00 AM
机器之心
千寻智能高阳团队最新成果:纯视觉VLA方案从有限数据中学到强大的空间泛化能力
设想一下刚学开车的情况:在训练场上,我们可能会反复练习特定动作:到了某个位置就踩刹车,拐到某个点就打方向盘。 久而久之,这些动作会形成 “条件记忆”,一旦环境发生变化,就容易手忙脚乱。 最近,千寻智能的研究人员注意到,基于模仿学习的视觉运动策略中也存在类似现象,并在论文《Do You Need Proprioceptive States in Visuomotor Policies?》中对此进行了深入探讨。
9/29/2025 11:33:00 AM
机器之心
大神爆肝一个月,复刻DeepMind世界模型,300万参数就能玩实时交互像素游戏
还记得 DeepMind 的 Genie 3 世界模型吗? 它首次让世界模型真实地模拟了真实世界。 最近,X 博主 anandmaj 在一个月内复刻 Genie 3 的核心思想,开发出了 TinyWorlds,一个仅 300 万参数的世界模型,能够实时生成可玩的像素风格环境,包括 Pong、Sonic、Zelda 和 Doom。
9/28/2025 6:46:00 PM
机器之心
下一代推荐系统长这样,Meta最新研究RecoWorld,从「猜你喜欢」到「听你指令」
大家每天都在和推荐系统打交道。 无论是刷短视频、逛电商、听音乐还是看新闻,背后都有一套「聪明」的算法在猜测你可能喜欢什么。 但你是不是偶尔觉得推荐内容千篇一律?
9/28/2025 6:41:00 PM
机器之心
商汤Seko上线一个月,超10万创作者选择它
创作减负,创意加速。 近期商汤推出的AI视频Agent Seko受到了大众的关注,目前已有10万创作者在使用。 Seko不是一个单纯的视频生成器,它是行业首发创编一体AI短片创作agent,集成了全行业主流的多模态生成大模型,靠对话就能直接成片。
9/28/2025 5:49:00 PM
新闻助手
网商银行丰收卡推出AI农事助手,与农业农村部信息中心共建
一款农民的专属AI智能体正式“上岗”。 网商银行丰收卡在上线首周用户量即突破百万,并与农业农村部信息中心联合共建国内首个AI农事助手。 它相当于农户手机里一位24小时在线的 “农技专家 气象专家 金融专家” 。
9/28/2025 4:09:00 PM
新闻助手
普通人也能「炼丹」了?我拿小红书文案喂给openPangu-Embedded-1B的模型,几步就把它变成了专属文案大师!
嗨,各位 AI 发烧友和走在技术前沿的朋友们! 最近圈子里风很大,大家聊的都是千亿、万亿参数的巨无霸模型,感觉没个 A100 八卡阵列,都不好意思说自己在搞 AI。 但今天,我想聊个反向操作:咱们普通人,如何用有限的资源,轻松驯服一个 AI 模型,让它变成我们专属的垂直领域小能手?
9/28/2025 3:20:00 PM
机器之心
OpenAI被指欺诈,用户输入可能会被秘密路由到新模型GPT-5-Chat-Safety
今年 8 月,GPT-5 发布,其在多个任务和基准上都表现卓越,但几乎和人世间的所有事物一样,并不是所有人都满意。 尤其是 GPT-5 发布后「OpenAI 移除 ChatGPT 中模型选择器」的做法更是备受诟病(尤其是移除了情感表达更佳的 GPT-4o),甚至引发了诸多用户的「网上请愿」,详见我们的报道《用户痛批 GPT-5,哭诉「还我 GPT-4o」,奥特曼妥协了》。 一位用户在 Reddit 愤怒发帖表示 OpenAI 的做法让他直接取消了订阅,并称「OpenAI 失去了我所有的尊重」。
9/28/2025 3:14:00 PM
机器之心
乐享科技官宣完成2亿元天使++轮融资,天使轮融资总金额近5亿元,持续聚焦消费级具身智能产品研发
9月28日,消费级具身智能机器人企业 ---苏州乐享智能科技有限公司(以下简称 “乐享科技”)正式宣布完成2亿元“天使 ”轮融资。 本轮融资由钟鼎资本领投,老股东 IDG 资本持续加投,此前获得来自锦秋基金的领投投资。 资金将主要用于自研核心零部件攻关、机器人本体与运动控制技术开发及意识仿生模型迭代等,目标加速消费级具身智能产品规模化落地。
9/28/2025 2:13:00 PM
新闻助手
「从追赶者到引领者,路有多远?」 我们和CANN一线开发者聊了聊
AI 行业很多人相信,我们正在或已经进入所谓的「AI 下半场」。 在这一轮 AI 的浪潮中,硬件的竞争早已不再是单纯的算力比拼,而是一场围绕软件、开发者与生态的「护城河」之战。 当国产 AI 生态的转型成为科技领域的时代呼声,华为昇腾及其异构计算架构 CANN 正站在了这场变革的聚光灯下。
9/28/2025 1:20:00 PM
机器之心
RLHF与RLVR全都要,陈丹琦团队最新力作将推理能力拓展到通用智能
思考自身行为的后果,并在必要时进行修正 —— 这是人类智慧的核心特征之一。 一个月前,我们曾报道过清华姚班校友、普林斯顿教授陈丹琦似乎加入 Thinking Machines Lab 的消息。 有些爆料认为她在休假一年后,会离开普林斯顿,全职加入 Thinking Machines Lab。
9/28/2025 1:11:00 PM
机器之心
一文读懂鲸智百应:驱动组织进化的企业AI操作系统,让企业从「用AI」到「是AI」
「统一认知、智能执行、决策中枢、记忆进化、智能体工厂、AI治理」六大维度,让企业彻底跳出「用AI」的工具思维,成为「AI原生组织」。 走进任何一家大中型企业,「系统横跳」已成为日常:员工每天要在5个以上业务系统间切换完成工作,80%的生产数据沉睡在ERP、CRM、OA的孤岛中无法调用,AI工具仍停留在「问答式辅助」而非「全流程执行」...... 本该驱动业务迭代的核心资产,成了看得见、用不上的「数据孤岛」,企业数字化落地早已陷入「工具堆砌而非价值重构」的困境。
9/28/2025 1:06:00 PM
机器之心
登上NeurIPS,Genesis开创无需OCC引导的多模态生成新范式,在视频与激光雷达指标上达到SOTA水平
由华中科技大学与小米汽车提出了业内首个无需 OCC 引导的多模态的图像 - 点云联合生成框架 Genesis。 该算法只需基于场景描述和布局(包括车道线和 3D 框),就可以生成逼真的图像和点云视频。 论文题目:Genesis: Multimodal Driving Scene Generation with Spatio-Temporal and Cross-Modal Consistency论文链接: 链接:xiaomi-research/genesisGenesis 采用两阶段架构:第一阶段基于透视图投影的布局和场景描述等条件,利用基于 DiT 的扩散模型学习 3D 变分自编码器编码的环视图特征; 第二阶段将第一阶段多视角视频序列转到鸟瞰图的特征空间,并结合场景描述和布局等条件,学习 2D 自编码器编码的点云特征。
9/28/2025 1:00:00 PM
机器之心
Information Fusion | 融合视觉与序列,湖南大学等提出药物相互作用预测新方法
作者 | 论文团队编辑 | ScienceAI药物 - 药物相互作用(DDIs)的准确预测对于保障药物安全和加速新药研发至关重要。 然而,现有方法大多依赖整体分子结构或子结构表征,难以充分捕捉功能性 motif 之间的交互关系,而这恰恰是 DDIs 的根本原因。 与此同时,分子图像能够天然保留分子在二维 / 三维空间中的构象特征与视觉线索(如纹理、阴影、颜色和空间布局),这些信息往往难以通过单一图或序列表示捕捉,因而为刻画 motif 间的空间互作提供了独特优势。
9/28/2025 11:58:00 AM
ScienceAI