应用
亚马逊“盲眼”机器人30秒跑酷首秀惊艳!华人学者领衔
henry 发自 凹非寺. 量子位 | 公众号 QbitAI你见过这样的“盲眼”机器人demo吗? 它在完全看不见的情况下——没有摄像头、雷达或任何感知单元——主动搬起9斤重的椅子,爬上1米高的桌子,然后翻跟头跳下。
10/6/2025 2:32:07 PM
henry
重生之在《我的世界》做山姆·奥特曼:网友在线手搓ChatGPT
henry 发自 凹非寺. 量子位 | 公众号 QbitAI逆天,太逆天。 一老哥在《我的世界》上手搓了一个ChatGPT!
10/6/2025 2:21:59 PM
henry
Sora2还在5秒打转,字节AI生视频已经4分钟“起飞”
鹭羽 发自 凹非寺. 量子位 | 公众号 QbitAI从5秒到4分钟,Sora2也做不到的分钟级长视频生成,字节做到了! 先来看一个前方潜水员拍摄的“真实”海底世界Vlog:视频链接:,有发现么?
10/6/2025 2:12:11 PM
鹭羽
开源仅一周,鹅厂文生图大模型强势登顶,击败谷歌Nano-Banana
一夜之间,文生图领域的「王座」被国产大模型拿下! 主角是腾讯混元团队发布并开源仅一周的原生多模态生图模型 —— 混元图像 3.0(HunyuanImage 3.0)。 在国际权威 AI 模型评测榜单 LMArena 上,HunyuanImage 3.0 一举超越了谷歌风头无两的 Nano-Banana 以及字节的 Seedream 4.0,位列文生图(Text-to-Image)综合榜单和开源榜单第一。
10/5/2025 8:36:00 PM
机器之心
推理token减少46%!Meta新方法缩短思维链,告别重复推导
时令 发自 凹非寺. 量子位 | 公众号 QbitAI大模型老走重复步骤,导致思维链越来越长怎么办? Meta、Mila-Quebec AI Institute、蒙特利尔大学和普林斯顿大学联合提出元认知复用(Metacognitive Reuse) 机制。
10/5/2025 4:59:54 PM
时令
北大校友、华人学者金驰新身份——普林斯顿大学终身副教授
今天,华人学者金驰(Chi Jin)宣布他在普林斯顿晋升为终身副教授。 金驰于 2019 年加入普林斯顿大学电气与计算机工程系,担任助理教授。 在普林斯顿的 6 年任期内,他在 AI 领域的学术影响力迅速提升。
10/4/2025 2:51:00 PM
机器之心
如何做好AI产品的用户体验?来看百度的实战案例复盘!
前言. 行业内持续探索 AI 内容生成与创作工具,由 AI 驱动的创作方式正逐步成为主流。 不仅为用户提供了个性化创作的有力支持,也能够激发灵感、降低门槛,使即便没有专业背景的用户也能轻松表达自己的想法。
10/4/2025 12:22:57 AM
百度MEUX 团队
Meta内部混乱持续:FAIR自由不再,LeCun考虑辞职
Meta 内部混战又有新剧情了,这次主角是 FAIR 实验室。 据 The Information 报道,两位知情人士透露,Meta 最近对 FAIR 实验室施加了一项新政策:所有研究成果在公开发表前,必须通过额外的内部审查。 这项政策在 FAIR 内部引起了轩然大波。
10/3/2025 3:01:00 PM
机器之心
刚刚,Anthropic新CTO上任,与Meta、OpenAI的AI基础设施之争一触即发
就在刚刚,Anthropic 迎来了新的首席技术官(CTO)—— 前 Stripe 首席技术官 Rahul Patil。 据报道,Rahul Patil 于本周早些时候加入公司,接替了联合创始人 Sam McCandlish,后者将转任首席架构师一职。 Rahul Patil 在社媒上表达了自己加入 Anthropic 的激动之情与未来期许。
10/3/2025 2:39:00 PM
机器之心
全球价值最高创企诞生,OpenAI估值创纪录来到5000亿美元
几天前,OpenAI 重磅发布了全新一代的视频大模型 Sora 2,不仅在物理准确性、真实感和可控性方面都优于以往的系统,还具备同步的对话和音效能力。 Altman 称之为「ChatGPT for creativity」时刻。 就在昨天,OpenAI 的「身价」又涨了。
10/3/2025 2:36:00 PM
机器之心
Sora 2数手指翻车,奥特曼成第一批「受害者」,被AI玩成最惨打工人
奥特曼大型社死现场。 Sora 2,强大如斯,却也数不明白手指。 X 网友 @fofrAI 整了个提示词测试 Sora 2:a man counts out loud from 1 to 10, using his fingers and holding them up as he goes.(一名男子一边举起手指,一边大声数着从 1 到 10。
10/2/2025 3:29:00 PM
机器之心
开发者狂喜:Thinking Machines发布首款产品Tinker,后训练麻烦全给包了
对于大模型开发者 / 研究者来说,今天是重要的一天。 因为刚刚,OpenAI 前 CTO Mira Murati 创办的 Thinking Machines 推出了首款产品 ——Tinker。 简单来说,Tinker 是一个 API,用于帮开发者 / 研究人员微调语言模型。
10/2/2025 3:13:00 PM
机器之心
小红书发布FireRedChat:首个可私有化部署的全双工大模型语音交互系统
小红书智创音频团队推出业内首个支持私有化部署的全双工大模型语音交互系统 FireRedChat,自研流式 pVAD 与 EoT 让语音交互更加自然,首发级联与半级联两套实现,端到端时延逼近工业级应用。 彻底开源、可私域落地,打造真正 “知冷暖、能共情、懂表达” 的语音 AI。 小红书智创音频团队发布 FireRedChat—— 业内首个支持私有化部署的全双工大模型语音交互系统,直击延迟高、噪声敏感、可控性差、依赖外部 API 等痛点。
10/2/2025 3:07:00 PM
机器之心
Sora 2干翻Veo 3?超全对比实测:会中文脱口秀,但体操翻车,附有效邀请码
这次,OpenAI 又搞了波大的,祭出 Sora2,可以直接生成最长 20 秒的 1080p 视频。 比如,有网友拿奥特曼生成了 GPU 外卖小哥,甚至还有去超市偷显卡的剧情。 相比于旧版本,Sora 2 在物理准确性、真实感和可控性方面都更胜一筹,而且它还和谷歌 Veo3 一样具备音画同步能力。
10/1/2025 8:17:00 PM
机器之心
节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世
新一代大模型的发布,都赶在了国庆假期前。 昨天,深度求索刚刚开源 DeepSeek-V3.2-Exp。 今天,另一国产大模型之光智谱 AI 也正式发布了旗下新一代旗舰模型 GLM-4.6,刚好撞车 Claude Sonnet 4.5。
9/30/2025 7:16:00 PM
机器之心
CAIR开源发布超声基座大模型EchoCare“聆音”,10余项医学任务性能登顶
2025年9月17日,中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型(简称“聆音”)。 该模型基于超过450万张、涵盖50多个人体器官的大规模超声影像数据集训练而成,在器官识别、器官分割、病灶分类等10余项典型超声医学任务测试中表现卓越,性能全面登顶。 同时,“聆音”已在山东大学齐鲁医院、中南大学湘雅医院、香港中文大学医学院的多个超声检查领域完成3000多例临床回溯性验证,与当前SOTA(最优)模型相比,性能平均提高3%~5%。
9/30/2025 7:07:00 PM
机器之心
以赛促创新,推动具身智能机器人“真干活”,2025年第二届中关村具身智能机器人应用大赛火热报名中
在人形机器人与具身智能技术浪潮以迅猛之势席卷全球的当下,人形机器人如何落地成为社会关注的焦点。 9月以来,诸多聚焦落地的人形机器人订单接连达成,似乎为这一难题提供了解决方案,银河通用机器人经营的无人超市“银河太空舱”开张,该零售店成为商业场景下全球首个面向消费者常态化经营的具身智能落地场景;加速进化也宣布从球场走向家庭,将推出面向极客和教育场景的消费级机器人;优必选签署2.5亿元具身智能人形机器人产品及解决方案采购合同,直击工业场景的痛点需求;智平方与慧智物联达成战略合作,在未来三年内将部署超1000台具身智能机器人,覆盖从仓储物流、上下物料、零部件装配到质检测试等全流程;众擎机器人与多伦科技签署战略合作协议,计划在未来三年内采购不低于2000台具身智能人形机器人用于重点领域场景落地;星尘智能与仙工智能达成人形机器人千台级订单战略合作,预计在未来两年内推动上千台AI机器人在工业、制造、仓储、物流等场景大规模、分阶段部署。 这些商业化订单无疑揭示了人形机器人火热的现状,那么还有哪些真实场景人形机器人还有表现机会?
9/30/2025 10:39:00 AM
新闻助手
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测