资讯列表

分类

标签

在具身智能的岔路口，这场论坛把数据、模型、Infra聊透了

当机器人成为各大科技展会最受瞩目的焦点，当具身智能论坛场场爆满、一票难求，我们不难发现：这个领域正在经历前所未有的关注热潮。然而，热潮之下，仍有诸多关键议题悬而未决：面对数据稀缺，有人寄希望于合成数据的突破，有人坚持真机数据才是根本；在技术路线之争中，有人押注端到端的整体范式，有人则认为分层架构更符合演进规律；至于模型形态，有人视 VLA 为智能的最终归宿，也有人认为世界模型才是真正的未来。现阶段出现这种分歧非常正常，因为整个行业的发展路径尚未收敛。

9/29/2025 11:40:00 AM 机器之心

千寻智能高阳团队最新成果：纯视觉VLA方案从有限数据中学到强大的空间泛化能力

设想一下刚学开车的情况：在训练场上，我们可能会反复练习特定动作：到了某个位置就踩刹车，拐到某个点就打方向盘。久而久之，这些动作会形成 “条件记忆”，一旦环境发生变化，就容易手忙脚乱。最近，千寻智能的研究人员注意到，基于模仿学习的视觉运动策略中也存在类似现象，并在论文《Do You Need Proprioceptive States in Visuomotor Policies?》中对此进行了深入探讨。

9/29/2025 11:33:00 AM 机器之心

大神爆肝一个月，复刻DeepMind世界模型，300万参数就能玩实时交互像素游戏

还记得 DeepMind 的 Genie 3 世界模型吗？它首次让世界模型真实地模拟了真实世界。最近，X 博主 anandmaj 在一个月内复刻 Genie 3 的核心思想，开发出了 TinyWorlds，一个仅 300 万参数的世界模型，能够实时生成可玩的像素风格环境，包括 Pong、Sonic、Zelda 和 Doom。

9/28/2025 6:46:00 PM 机器之心

下一代推荐系统长这样，Meta最新研究RecoWorld，从「猜你喜欢」到「听你指令」

9/28/2025 6:41:00 PM 机器之心

商汤Seko上线一个月，超10万创作者选择它

创作减负，创意加速。近期商汤推出的AI视频Agent Seko受到了大众的关注，目前已有10万创作者在使用。 Seko不是一个单纯的视频生成器，它是行业首发创编一体AI短片创作agent，集成了全行业主流的多模态生成大模型，靠对话就能直接成片。

9/28/2025 5:49:00 PM 新闻助手

网商银行丰收卡推出AI农事助手，与农业农村部信息中心共建

一款农民的专属AI智能体正式“上岗”。网商银行丰收卡在上线首周用户量即突破百万，并与农业农村部信息中心联合共建国内首个AI农事助手。它相当于农户手机里一位24小时在线的 “农技专家气象专家金融专家” 。

9/28/2025 4:09:00 PM 新闻助手

普通人也能「炼丹」了？我拿小红书文案喂给openPangu-Embedded-1B的模型，几步就把它变成了专属文案大师！

嗨，各位 AI 发烧友和走在技术前沿的朋友们！最近圈子里风很大，大家聊的都是千亿、万亿参数的巨无霸模型，感觉没个 A100 八卡阵列，都不好意思说自己在搞 AI。但今天，我想聊个反向操作：咱们普通人，如何用有限的资源，轻松驯服一个 AI 模型，让它变成我们专属的垂直领域小能手？

9/28/2025 3:20:00 PM 机器之心

OpenAI被指欺诈，用户输入可能会被秘密路由到新模型GPT-5-Chat-Safety

今年 8 月，GPT-5 发布，其在多个任务和基准上都表现卓越，但几乎和人世间的所有事物一样，并不是所有人都满意。尤其是 GPT-5 发布后「OpenAI 移除 ChatGPT 中模型选择器」的做法更是备受诟病（尤其是移除了情感表达更佳的 GPT-4o），甚至引发了诸多用户的「网上请愿」，详见我们的报道《用户痛批 GPT-5，哭诉「还我 GPT-4o」，奥特曼妥协了》。一位用户在 Reddit 愤怒发帖表示 OpenAI 的做法让他直接取消了订阅，并称「OpenAI 失去了我所有的尊重」。

9/28/2025 3:14:00 PM 机器之心

乐享科技官宣完成2亿元天使++轮融资，天使轮融资总金额近5亿元，持续聚焦消费级具身智能产品研发

9月28日，消费级具身智能机器人企业 ---苏州乐享智能科技有限公司（以下简称 “乐享科技”）正式宣布完成2亿元“天使 ”轮融资。本轮融资由钟鼎资本领投，老股东 IDG 资本持续加投，此前获得来自锦秋基金的领投投资。资金将主要用于自研核心零部件攻关、机器人本体与运动控制技术开发及意识仿生模型迭代等，目标加速消费级具身智能产品规模化落地。

9/28/2025 2:13:00 PM 新闻助手

「从追赶者到引领者，路有多远？」我们和CANN一线开发者聊了聊

AI 行业很多人相信，我们正在或已经进入所谓的「AI 下半场」。在这一轮 AI 的浪潮中，硬件的竞争早已不再是单纯的算力比拼，而是一场围绕软件、开发者与生态的「护城河」之战。当国产 AI 生态的转型成为科技领域的时代呼声，华为昇腾及其异构计算架构 CANN 正站在了这场变革的聚光灯下。

9/28/2025 1:20:00 PM 机器之心

RLHF与RLVR全都要，陈丹琦团队最新力作将推理能力拓展到通用智能

思考自身行为的后果，并在必要时进行修正 —— 这是人类智慧的核心特征之一。一个月前，我们曾报道过清华姚班校友、普林斯顿教授陈丹琦似乎加入 Thinking Machines Lab 的消息。有些爆料认为她在休假一年后，会离开普林斯顿，全职加入 Thinking Machines Lab。

9/28/2025 1:11:00 PM 机器之心

一文读懂鲸智百应：驱动组织进化的企业AI操作系统，让企业从「用AI」到「是AI」

「统一认知、智能执行、决策中枢、记忆进化、智能体工厂、AI治理」六大维度，让企业彻底跳出「用AI」的工具思维，成为「AI原生组织」。走进任何一家大中型企业，「系统横跳」已成为日常：员工每天要在5个以上业务系统间切换完成工作，80%的生产数据沉睡在ERP、CRM、OA的孤岛中无法调用，AI工具仍停留在「问答式辅助」而非「全流程执行」...... 本该驱动业务迭代的核心资产，成了看得见、用不上的「数据孤岛」，企业数字化落地早已陷入「工具堆砌而非价值重构」的困境。

9/28/2025 1:06:00 PM 机器之心

登上NeurIPS，Genesis开创无需OCC引导的多模态生成新范式，在视频与激光雷达指标上达到SOTA水平

由华中科技大学与小米汽车提出了业内首个无需 OCC 引导的多模态的图像 - 点云联合生成框架 Genesis。该算法只需基于场景描述和布局（包括车道线和 3D 框），就可以生成逼真的图像和点云视频。论文题目：Genesis: Multimodal Driving Scene Generation with Spatio-Temporal and Cross-Modal Consistency论文链接：链接：xiaomi-research/genesisGenesis 采用两阶段架构：第一阶段基于透视图投影的布局和场景描述等条件，利用基于 DiT 的扩散模型学习 3D 变分自编码器编码的环视图特征；第二阶段将第一阶段多视角视频序列转到鸟瞰图的特征空间，并结合场景描述和布局等条件，学习 2D 自编码器编码的点云特征。

9/28/2025 1:00:00 PM 机器之心

Information Fusion | 融合视觉与序列，湖南大学等提出药物相互作用预测新方法

作者 | 论文团队编辑 | ScienceAI药物 - 药物相互作用（DDIs）的准确预测对于保障药物安全和加速新药研发至关重要。然而，现有方法大多依赖整体分子结构或子结构表征，难以充分捕捉功能性 motif 之间的交互关系，而这恰恰是 DDIs 的根本原因。与此同时，分子图像能够天然保留分子在二维 / 三维空间中的构象特征与视觉线索（如纹理、阴影、颜色和空间布局），这些信息往往难以通过单一图或序列表示捕捉，因而为刻画 motif 间的空间互作提供了独特优势。

9/28/2025 11:58:00 AM ScienceAI

窝呦，WenetSpeech-Chuan来了！首个超大规模川渝方言语料库震撼发布，川渝语音技术要火辣辣了！

大家伙儿都晓得，语音理解和合成发展得飞快，背后离不开大规模又高质量的语音数据集支撑。特别是语音识别（ASR）和语音合成（TTS），两者算是语音AI的头牌主角。但要说到咱们川渝地区的方言——川渝话，约1.2亿人都在用哦——它的研究就有点儿“捉襟见肘”了。

9/28/2025 11:39:00 AM 新闻资讯

汪军对话 Rich Sutton：大模型在一定程度上分散了我们对智能理解的注意力

在刚刚落幕的 RL China 2025 开幕式上，伦敦大学学院（UCL）汪军教授与图灵奖得主、“强化学习之父” Richard Sutton 展开了一场跨越地域的思想对话，从强化学习（RL）的学科根基出发，共探智能的本质与未来方向。汪军教授深耕智能信息系统领域多年，现任 UCL 计算机系教授，Turing Fellow，是华人强化学习社区 RL China 的联合发起人。 RL China 是由全球华人学者与强化学习相关从业者共同发起的非盈利性学术与技术交流平台，致力于推动强化学习及决策智能领域的研究、应用与教育。

9/28/2025 11:10:00 AM 刘欣

AI初创公司Friend砸超百万美元投放地铁广告：CEO称"赌上全部身家"推广争议产品

如果你最近在纽约地铁里看到那些推广AI可穿戴设备Friend的stark白色广告，那你见证的可能是AI行业史上最昂贵的营销赌局之一。 Friend公司CEO Avi Schiffman在接受Adweek采访时透露，公司在这次广告投放中花费超过100万美元，在地铁车厢内投放了超过11，000张广告卡片，在站台设置了1，000张海报，并在130个城市面板上展示广告。一些地铁站如West4th Street几乎被Friend的广告完全占据。

9/28/2025 10:46:31 AM AI在线

LTTS 与西门子携手推进智能制造与工艺工程的 AI 转型

L&T 科技服务有限公司（LTTS）近日宣布与西门子有限公司(Siemens Limited)扩展合作伙伴关系，旨在推动机器与生产线的仿真技术以及工业物联网(IIoT)技术的发展。这一合作将为 LTTS 的可持续发展领域设定新的创新标杆，涵盖了工艺工程、离散制造和工业产品等多个行业。图源备注：图片由AI生成，图片授权服务商Midjourney根据 LTTS 发布的声明，通过与西门子的合作，LTTS 将利用其数字技术组合，提供基于仿真的自动化解决方案以及 IIoT 驱动的解决方案，服务于包括汽车与交通、工业产品以及工艺与工厂工程等多个行业。

9/28/2025 10:46:30 AM AI在线

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

资讯列表

在具身智能的岔路口，这场论坛把数据、模型、Infra聊透了

千寻智能高阳团队最新成果：纯视觉VLA方案从有限数据中学到强大的空间泛化能力

大神爆肝一个月，复刻DeepMind世界模型，300万参数就能玩实时交互像素游戏

下一代推荐系统长这样，Meta最新研究RecoWorld，从「猜你喜欢」到「听你指令」

商汤Seko上线一个月，超10万创作者选择它

网商银行丰收卡推出AI农事助手，与农业农村部信息中心共建

普通人也能「炼丹」了？我拿小红书文案喂给openPangu-Embedded-1B的模型，几步就把它变成了专属文案大师！

OpenAI被指欺诈，用户输入可能会被秘密路由到新模型GPT-5-Chat-Safety

乐享科技官宣完成2亿元天使++轮融资，天使轮融资总金额近5亿元，持续聚焦消费级具身智能产品研发

「从追赶者到引领者，路有多远？」 我们和CANN一线开发者聊了聊

RLHF与RLVR全都要，陈丹琦团队最新力作将推理能力拓展到通用智能

一文读懂鲸智百应：驱动组织进化的企业AI操作系统，让企业从「用AI」到「是AI」

登上NeurIPS，Genesis开创无需OCC引导的多模态生成新范式，在视频与激光雷达指标上达到SOTA水平

Information Fusion | 融合视觉与序列，湖南大学等提出药物相互作用预测新方法

窝呦，WenetSpeech-Chuan来了！首个超大规模川渝方言语料库震撼发布，川渝语音技术要火辣辣了！

汪军对话 Rich Sutton：大模型在一定程度上分散了我们对智能理解的注意力

AI初创公司Friend砸超百万美元投放地铁广告：CEO称"赌上全部身家"推广争议产品

​LTTS 与西门子携手推进智能制造与工艺工程的 AI 转型

「从追赶者到引领者，路有多远？」我们和CANN一线开发者聊了聊

LTTS 与西门子携手推进智能制造与工艺工程的 AI 转型