AI在线 AI在线

资讯列表

智能体如何学会「想象」?深度解析世界模型嵌入具身系统的三大技术范式

智能体如何学会「想象」?深度解析世界模型嵌入具身系统的三大技术范式

长期以来,具身智能系统主要依赖「感知 - 行动」的反应式回路,缺乏对未来的预测能力。 而世界模型的引入,让智能体拥有了「想象」未来的能力。       具身智能机器人通过世界模型想象抓杯子任务那么关键问题来了:世界模型应该如何「放进」具身系统中?
12/22/2025 1:39:00 PM 机器之心
多智能体可信标准在ITU立项:信通院、蚂蚁、中国电信等共同推动

多智能体可信标准在ITU立项:信通院、蚂蚁、中国电信等共同推动

在近日于瑞士日内瓦落幕的国际电信联盟(ITU)电信标准化部门(ITU-T)第17研究组会议上,为响应《关于共建终端智能体生态的倡议》,由蚂蚁集团牵头,联合中国信息通信研究院泰尔终端实验室、中国电信等单位共同提出的《终端多智能体系统可信要求》国际标准项目(以下简称“标准”),经全会审议一致通过,正式成功立项。 该标准围绕“可信连接、可信身份、可信意图、可信授权”四大核心维度,为智能体间从建立连接、身份识别、意图传递到授权执行的各个环节提供明确安全指引与技术依据,旨在建立可信互联的底层框架,支撑产业生态安全、健康发展。 值得注意的是,此项国际标准的核心技术,源于蚂蚁参与发起的IIFAA(互联网可信认证联盟)智能体可信互联工作组,此前推动并开源的业内首个智能体可信互联技术——ASL。
12/22/2025 1:36:41 PM AI在线
谷歌推出A2UI开放标准:让AI代理秒变"界面设计师",告别枯燥文字对话

谷歌推出A2UI开放标准:让AI代理秒变"界面设计师",告别枯燥文字对话

谷歌近日推出A2UI(Agent-to-User Interface,代理到用户界面)开放标准,赋予AI代理即时创建图形界面的能力。 AI不再局限于发送文本回复,现在可以直接生成表单、按钮等用户界面元素,并无缝融入任何应用程序,为AI交互体验带来革命性变革。 从纯文本到动态界面:AI交互的范式转变A2UI采用Apache2.0许可证发布,旨在规范AI代理创建视觉响应的方式,弥合生成式AI与图形用户界面之间的鸿沟。
12/22/2025 12:21:31 PM AI在线
​耐力惊人!Anthropic 旗舰模型 Claude Opus4.5创下“长任务”处理新纪录

​耐力惊人!Anthropic 旗舰模型 Claude Opus4.5创下“长任务”处理新纪录

在追求大模型“高智商”的同时,AI 的持续执行能力正成为衡量其进化水平的新维度。 根据人工智能研究机构METR发布的最新基准测试,Anthropic 旗下的顶级模型Claude Opus4.5在处理超长时间任务方面展现出了统治级实力。 测试结果显示,Claude Opus4.5在维持50% 成功率的前提下,能够持续处理长达约 4小时49分钟 的复杂任务,这一表现刷新了行业历史记录。
12/22/2025 12:21:31 PM AI在线
OpenAI计算利润率飙升至70%!内部指标翻倍,商业化效率显著提升

OpenAI计算利润率飙升至70%!内部指标翻倍,商业化效率显著提升

在巨额投入与高调扩张的表象之下,OpenAI正悄然实现商业化效率的惊人跃升。 据多位知情人士透露,截至 2025 年 10 月,OpenAI内部关键指标——“计算利润率”(Compute Profit Margin)已攀升至70%,较 2024 年底的52%大幅提升,更是 2024 年 1 月水平的两倍。 这一数据虽未获官方正式确认(OpenAI发言人回应称“不披露该指标”),却释放出强烈信号:这家曾以“烧钱”著称的AI巨头,正加速从技术先锋向高效率盈利引擎转型。
12/22/2025 12:21:27 PM AI在线
旧金山大停电致Waymo全城“瘫痪”!数百辆无人出租车停摆街头,暴露自动驾驶脆弱性

旧金山大停电致Waymo全城“瘫痪”!数百辆无人出租车停摆街头,暴露自动驾驶脆弱性

一场突发的大规模停电,让全球最先进的自动驾驶系统瞬间“失能”。 当地时间12月21日晚,因太平洋燃气电力公司(PG&E)变电站起火引发的旧金山大范围断电,导致Waymo在旧金山的Robotaxi服务全面瘫痪——大量无人驾驶车辆停滞在道路中央与十字路口,造成严重交通拥堵,社交媒体上充斥着“被AI汽车堵死”的无奈视频。 据目击者拍摄的画面显示,多辆Waymo无人车静止不动,后方人类驾驶员寸步难行,只得绕行或长时间等待。
12/22/2025 12:21:27 PM AI在线
阿里千问发布 2025 十大 AI 提示词,​“股票”、“八字”上榜

阿里千问发布 2025 十大 AI 提示词,​“股票”、“八字”上榜

当代人的精神状态,正精准地映射在 AI 的对话框里。 阿里千问官方近日发布了“2025十大 AI 提示词”榜单,通过用户与千问 App 交互的高频场景,勾勒出了一幅生动的年度社会心态白皮书。 榜单中,“股票”力压群雄排名榜首,反映出在波动的市场环境下,AI 已成为股民们寻求分析与心理建设的重要工具。
12/22/2025 12:21:27 PM AI在线
造硬件造数据:诺亦腾机器人完成 Pre-A+ 轮融资,加速攻克具身智能数据荒

造硬件造数据:诺亦腾机器人完成 Pre-A+ 轮融资,加速攻克具身智能数据荒

具身智能与人形机器人数据服务商**诺亦腾机器人(Noitom Robotics)**近日宣布完成 Pre-A 轮融资。 本轮融资由启明创投领投,五源资本、君联资本等机构参投,经纬创投、英诺天使基金追加投资,最终实现超额认购。 本轮融资后,加上此前由阿尔法公社领投的 Pre-A 轮,诺亦腾机器人累计募集资金已达数亿元人民币。
12/22/2025 12:21:27 PM AI在线
​赋能AI智能体!Anthropic正式发布Claude“技能”开放标准

​赋能AI智能体!Anthropic正式发布Claude“技能”开放标准

人工智能正从“单纯的大模型”向“能够代办任务的智能体”加速演进。 AIbase从最新报道中获悉,Anthropic于本周四对其 Claude 模型中的“技能”(Skills)功能进行了重大升级,旨在通过结构化的任务训练,让 AI 能够更加自主地协助用户处理特定工作。 此次更新的核心动作是将 “智能体技能”(Agent Skills) 规范发布为一项开放标准。
12/22/2025 12:21:27 PM AI在线
「Tokens 经济」引领 AI 产业化落地,火山引擎凭什么后来居上

「Tokens 经济」引领 AI 产业化落地,火山引擎凭什么后来居上

12月18日,上海世博中心,火山引擎原动力大会现场人山人海。 谭待表示,截至今年12月,豆包大模型日均Tokens使用量已突破50万亿,居中国第一、全球第三;超过100家企业在火山引擎上累计Tokens使用量超过一万亿。 大会发布的豆包大模型1.8、豆包视频生成模型Seedance 1.5 pro等一系列模型,一如既往,不负众多观众的期待。
12/22/2025 11:25:00 AM 聪聪
新石器无人车官宣 CES 2026 发布全新一代“最后一公里”配送机器人

新石器无人车官宣 CES 2026 发布全新一代“最后一公里”配送机器人

AI在线 12 月 22 日消息,新石器无人车今日官宣,将携主力无人车矩阵及全新产品,首次亮相美国拉斯维加斯 CES 2026 展会现场(AI在线注:2026 年 1 月 6 日-9 日),并面向全球行业决策者与生态伙伴,发布基于人工智能的新一代城市配送解决方案。 从海报可以看到,新石器无人车将发布全新一代“最后一公里”配送机器人,该机器人尺寸较小,预计用于上门配送等场景。 今年 10 月,新石器完成逾 6 亿美元 D 轮融资,创中国自动驾驶领域融资纪录。
12/22/2025 11:07:51 AM 汪淼
计算所严明玉团队新作: Attention 并非永远是瓶颈,多 GPU 并不一定更快

计算所严明玉团队新作: Attention 并非永远是瓶颈,多 GPU 并不一定更快

随着大语言模型逐渐走向真实应用,推理阶段的性能问题正在成为制约落地的关键因素。 模型规模不断增大、上下文持续拉长,再加上 RAG、MoE 等新用法的引入,使得延迟、吞吐和能耗不再只是“调一调参数”的问题,而是直接影响系统架构和算力成本的核心挑战。 围绕这些问题,来自中国科学院计算所的严明玉团队,联合中国电信云计算研究院、浙江实验室和北京大学的研究者,在论文《A Systematic Characterization of LLM Inference on GPUs》中,对大语言模型在 GPU 上的推理行为进行了系统研究。
12/22/2025 10:56:00 AM 郑佳美
阿里通义千问 Qwen 发布分层图像编辑模型Qwen-Image-Layered,​一键生成“Photoshop图层”

阿里通义千问 Qwen 发布分层图像编辑模型Qwen-Image-Layered,​一键生成“Photoshop图层”

长期以来,将一张普通的扁平化照片转换为可灵活编辑的图层文件,一直是专业设计师的“刚需”。 据 AIbase 报道,阿里巴巴旗下人工智能部门 Qwen 近日推出了一款革命性的图像编辑模型 —— Qwen-Image-Layered。 该模型能够直接将静态照片分解为多个具有透明背景的独立 RGBA 图层,让 AI 图像编辑具备了类似 Photoshop 的结构化操作能力。
12/22/2025 10:50:54 AM AI在线
亚马逊 AGI 部门换帅:云业务老将接棒,力求终结 AI “落后局势”

亚马逊 AGI 部门换帅:云业务老将接棒,力求终结 AI “落后局势”

面对微软、谷歌及 OpenAI 等对手的步步紧逼,全球电商与云巨头亚马逊正试图通过一场高层地震来扭转其在 AI 赛道的被动局面。 AIbase 获悉,亚马逊首席执行官安迪·贾西(Andy Jassy)近日宣布,公司AGI(通用人工智能)部门负责人罗希特·普拉萨德(Rohit Prasad)将于明年离职,由 AWS 高级副总裁彼得·德桑蒂斯(Peter DeSantis)接过帅印。 德桑蒂斯是亚马逊效力超过30年的元老级人物,他将领导一个全新的扩权部门。
12/22/2025 10:50:51 AM AI在线
全球最强开源医疗大模型在浙江发布!1000亿参数“安诊儿”全面支持国产芯片,聚焦精准诊疗与心理健康

全球最强开源医疗大模型在浙江发布!1000亿参数“安诊儿”全面支持国产芯片,聚焦精准诊疗与心理健康

中国医疗AI迈出关键一步。 12 月 20 日,国家人工智能应用中试基地(医疗)在浙江正式对外开放产业园区,并重磅发布由蚂蚁集团与基地联合研发的“安诊儿医疗大模型”(AntAngelMed)。 该模型以 1000 亿参数的规模,成为全球参数量最大的开源医疗大模型,采用混合专家架构(MoE),全面兼容昇腾、寒武纪等国产芯片,从训练到推理实现全链路技术自主、数据安全、系统可控。
12/22/2025 10:50:51 AM AI在线
三星联手谷歌!全球首款Gemini AI冰箱CES前夕曝光,食材识别+红酒管家全靠AI

三星联手谷歌!全球首款Gemini AI冰箱CES前夕曝光,食材识别+红酒管家全靠AI

智能家居正式迈入“AI视觉管家”时代。 三星电子宣布,将于下月拉斯维加斯CES国际消费电子展前,在美国率先推出搭载谷歌Gemini大模型的全新Bespoke AI冰箱——这也是全球首款将Gemini技术深度集成至家电产品的消费级设备。 凭借内置高精度摄像头与AI视觉理解能力,这款冰箱不仅能自动识别数十种食材,还能推荐食谱、生成购物清单,甚至管理红酒收藏,重新定义厨房智能体验。
12/22/2025 10:50:51 AM AI在线
告别僵硬AI视频!快手Kling2.6让你的声音"活"在AI角色里,复杂舞蹈动作也能完美复刻

告别僵硬AI视频!快手Kling2.6让你的声音"活"在AI角色里,复杂舞蹈动作也能完美复刻

快手近日将其视频生成器Kling升级至2.6版本,推出语音控制和动作控制两大核心功能,为AI视频生成领域带来突破性进展。 此次更新不仅实现了原生音频生成,还大幅提升了复杂动作的处理精度。 语音控制:从音效到个性化声音定制Kling2.6的语音控制功能建立在同步视频音频生成技术基础上,与Google Veo3和Sora2类似,能够生成与视频内容匹配的音效、人声和音乐。
12/22/2025 10:50:51 AM AI在线
旧金山大停电变“智驾大考”,Waymo 数百辆无人车瘫痪街头

旧金山大停电变“智驾大考”,Waymo 数百辆无人车瘫痪街头

据 AIbase 报道,旧金山于2025年12月20日周六午后突发大范围停电,导致 Alphabet 旗下的自动驾驶领军企业 Waymo 全面暂停在旧金山湾区的无人驾驶打车服务。 此次事故由8街与 Mission 街路口的一处 PG&E 变电站起火引发,导致全市约13万用户断电,大量交通信号灯熄灭。 由于无法识别瘫痪的交通基础设施,数百辆 Waymo 自动驾驶车在全市范围内停摆或“抛锚”,部分车辆直接停在特克大道等路段的正中央,造成了严重的交通拥堵。
12/22/2025 10:50:51 AM AI在线