应用
可打电话可对讲!全球首款奥特曼 AI 互动对话器来了
12 月 18 日,在上海举办的火山引擎冬季 FORCE 原动力大会上,AI 玩具行业领军企业跃然创新(Haivivi)联合创始人高峰受邀出席并发表演讲。 作为火山引擎重磅合作伙伴,高峰结合跃然创新旗下全球首款端到端 AI 玩具产品 CocoMate,复盘了双方以底层技术突破驱动行业进步的发展轨迹。 与此同时,高峰还正式官宣了跃然创新旗下第三代旗舰新品——“光之召唤”奥特曼 AI 互动对话器,该产品以奥特曼宇宙系列人物的彩色计时器为设计蓝本,支持多种佩戴方式,并搭载奥特曼角色 AI 互动对话、无限距离组队对讲、感应式 AI 主题游戏、语音电话四大核心功能。
云宇星空大模型正式发布,上海市规划资源局与商汤大装置联合打造
近日,全国规划资源领域首个基础大模型 “云宇星空大模型(专业版)” 在上海正式发布,该模型由上海市规划资源局联合商汤大装置共同研发。 云宇星空大模型(专业版)基于海量高质量“文本-图像-空间”多模态的行业语料,进行了城市空间治理领域全链路认知与决策能力的突破性构建,构建了集“时空理解生成、知识整合检索、模型智能调度”于一体的技术底座,具备了“问不倒、能调图、会统计、能识图、会报告”五大核心专业能力,将成为上海规划和自然资源行业专业人员处理各类专业问题的“AI伙伴”。 作为全国规划资源领域首个基础大模型,云宇星空行业基座大模型打造了“基座大模型 六大垂类模型”的“1 6”模型体系,兼顾通用能力与行业深度,支撑复杂空间治理场景下的专业智能需求;同时围绕不同业务目标,搭建面向多领域、多任务的智能体体系。
Claude AI 任务模式开测:能提问、会计划、懂执行,全程可视化
AI在线 12 月 19 日消息,科技媒体 testingcatalog 昨日(12 月 18 日)发布博文,报道称 Anthropic 旗下 Claude 的“任务模式”(Tasks Mode)已进入功能验证阶段,目标打造全能型 AI 智能体。 根据曝光的内部测试,新版界面启用了直观的双面板布局:右侧面板专门用于展示用户上传或模型生成的上下文文件(Context Files),而新增的左侧进度区则动态呈现多步任务的执行流。 这一设计实现可视化复杂的后台逻辑,用户不仅能直接下达指令,还能全程“监工”模型的每一步操作。
无人货运大变局!菜鸟拟入股九识智能,两大“万元机”巨头欲整合业务
根据新浪科技报道,今日,菜鸟集团拟入股无人城配自动驾驶企业九识智能(Zelostech),双方正就无人车业务的深度整合展开秘密洽谈。 据悉,此次合作重点在于重组双方的无人车业务资源,以打造更具竞争力的联合体,而菜鸟未来或将授权九识智能使用其品牌。 针对该消息,菜鸟及九识智能方面目前均保持缄默。
Luma发布Ray3 Modify:AI视频编辑新突破,保留演员表演细节,一键换装、换场景
AI视频生成领域迎来关键升级。 由a16z投资的3D与AI视频公司Luma AI近日推出全新模型 Ray3Modify,首次实现在保留原始演员表演精髓的前提下,对已有实拍视频进行高保真AI修改——无论是更换角色外观、切换服装、变换场景,还是生成平滑过渡镜头,演员的动作节奏、眼神方向、情感表达均被完整保留。 这一突破直击创意工作室的核心痛点:传统AI视频工具虽能生成惊艳画面,却难以控制细节,导致演员的真实表演在后期处理中丢失。
防范未成年人风险:OpenAI与Anthropic将推出AI年龄预测功能
随着全球对青少年网络安全的关注度日益提高,两大人工智能巨头OpenAI和Anthropic于本周四宣布,将采取更积极的措施来识别和保护未成年用户。 这两家公司正计划通过 AI 模型预测用户年龄,并针对青少年群体更新产品指南。 OpenAI:安全高于一切,更新青少年互动准则OpenAI在其最新发布的“模型规范”中新增了四项针对18岁以下用户的核心原则。
字节跳动 AI 手机合作方案曝光,免收 Token 分成开启“让利换入口”
据界面报道,字节跳动正积极推进与 vivo、联想、传音等头部硬件厂商的 AI 手机深度合作,计划通过在设备操作系统层面预装 AIGC 插件(如“豆包手机助手”),以此攫取至关重要的 AI 流量入口,并扭转目前大模型在执行层面的被动局面。 多位 vivo 内部员工已证实双方确认合作,正在商讨落地细节。 此次合作的核心在于字节跳动开出了极具诱惑力的“分成方案”。
OpenAI 财务风险引发热议 经济学家认为其并非 “太大而不能倒”
根据彭博社的报道,OpenAI 的财务风险问题备受关注。 尽管 OpenAI 已经成为人工智能领域的重要领导者,但美国著名经济学家、哈佛大学教授杰森・弗尔曼(Jason Furman)明确指出,这家公司 “绝非” 大到不能倒。 弗尔曼的观点引发了对 OpenAI 未来发展潜力和市场地位的讨论。
用时 31 个月:ChatGPT 移动端全球累计吸金突破 30 亿美元大关,跑赢 TikTok 与多款流媒体应用
AI在线 12 月 19 日消息,据应用数据分析机构 Appfigures 估算,ChatGPT 移动端在全球范围内的消费者累计支出已突破 30 亿美元(现汇率约合 211.53 亿元人民币),成为又一重要里程碑。 该数据统计了 ChatGPT 自 2023 年 5 月上线以来,在 iOS 与 Android 平台上的全部用户付费金额,其中绝大部分收入集中在今年。 数据显示,2025 年全球用户在 ChatGPT 移动应用上的支出约为 24.8 亿美元(AI在线注:现汇率约合 174.86 亿元人民币),同比增长 408%。
美团推出 SOTA 级虚拟人视频生成模型 LongCat-Video-Avatar
近日,美团旗下的 LongCat 团队宣布开源其最新的视频生成模型 ——LongCat-Video-Avatar,标志着虚拟人技术的又一次重要突破。 该模型在长视频生成领域表现优异,具有多项核心功能,吸引了广泛的开发者关注。 LongCat-Video-Avatar 基于此前的 LongCat-Video 模型,延续了 “一个模型支持多任务” 的设计理念,原生支持音频文本转视频(AT2V)、音频文本图像转视频(ATI2V)及视频续写等功能。
研究揭示新趋势:三分之一英国公民借助 AI 寻求情感支持
根据英国政府的 AI 安全机构最新报告,约三分之一的英国公民已经开始使用人工智能(AI)技术来获得情感支持、陪伴或社交互动。 该报告显示,近10% 的人每周都会使用像聊天机器人这样的系统来满足情感需求,4% 的人则是每日使用。 报告呼吁进行更多研究,特别是在最近发生的与 AI 有关的自杀事件背景下,强调了这一领域的潜在风险。
Mythic 融资 1.25 亿美元,力图以超高能效 AI 芯片挑战 NVIDIA
Mythic 是一家位于加利福尼亚帕洛阿尔托的 AI 芯片公司,近日成功筹集 1.25 亿美元的资金,计划开发模拟处理单元(APU),其能效将比现有的 GPU 提高多达 100 倍。 这轮融资由深科技风险投资公司 DCVC 主导,资金将用于推动 Mythic 的产品开发、软件完善及商业规模扩展。 除了 DCVC,众多投资者包括 NEA、Atreides、Future Ventures、Softbank KR、S3 Ventures、Linse Capital、One Madison Group 和 Catapult,以及本田汽车和洛克希德・马丁也参与了此次融资。
ElevenLabs打通WhatsApp!AI语音助理可接打电话、批量外呼,客服革命正式落地
全球AI语音领导者ElevenLabs于2025年12月18日宣布一项里程碑式更新:其AI语音智能体(Agents)正式深度集成WhatsApp,首次实现文字 语音双模全渠道交互——用户既可通过文字聊天获取服务,也能直接拨打或接听WhatsApp语音电话,与拥有超逼真人声的AI助理实时对话。 这不仅是技术升级,更是一场客服范式的重构。 企业仅需简单配置,即可在WhatsApp上部署具备以下能力的AI语音助手:- ✅ 自然接听来电:用户拨打企业WhatsApp号码,AI即以高度拟人化语音应答;- ✅ 主动外呼服务:支持单次或批量外呼,适用于预约提醒、催收通知、客户回访等高频场景;- ✅ 双向文字对话:用户发送文字,AI秒级响应,体验如真人客服;- ✅ 实时语音交互:无论用户发送语音消息,还是AI主动拨打电话,均实现低延迟、高自然度的流畅对话。
AI 刻画时代!DeepSeek 当选“汉语盘点 2025”年度国内词
根据 AIbase 报道,在 12 月 19 日由国家语言资源监测与研究中心、商务印书馆及新华网联合主办的“汉语盘点 2025”活动中,备受瞩目的 2025 年度国内字词正式在北京揭晓。 凭借在人工智能领域实现的突破性进展与极高的社会讨论度,**“深度求索(DeepSeek)”正式当选为 2025 “年度国内词”,而 2025 “年度国内字”则由“韧”**摘得。 今年恰逢“汉语盘点”活动举办 20 周年。
T5Gemma模型再更新,谷歌还在坚持编码器-解码器架构
编辑|冷猫最近,或许是年底了,谷歌的发布变得有些密集。 比如昨天,谷歌发布了在智能 / 成本上全球性价比最高的模型 Gemini 3 Flash。 在 Gemini 3 Flash 发布后,大家都以为谷歌今年的模型发布已经收官的时候,谷歌却又掏出了一个让大家都意想不到的模型更新:T5Gemma 2。
认知偏差、落地断层、体验割裂是目前AI产品的三大痛点|百度王颖@MEET2026
编辑部 整理自 MEET2026. 量子位 | 公众号 QbitAI当AI从“能说会道”的聊天伙伴,演进为“能想会做”的行动助手,一个关键问题却日益凸显:. 为什么AI能力越强,用户完成复杂任务反而越“累”?
商汤大装置助力全国规划资源领域首个基础大模型-“云宇星空大模型(专业版)”正式发布
近日,全国规划资源领域首个基础大模型 “云宇星空大模型(专业版)” 在上海正式发布,该模型由上海市规划资源局联合商汤大装置共同研发。 云宇星空大模型(专业版)基于海量高质量 “文本 - 图像 - 空间” 多模态的行业语料,进行了城市空间治理领域全链路认知与决策能力的突破性构建,构建了集 “时空理解生成、知识整合检索、模型智能调度” 于一体的技术底座,具备了 “问不倒、能调图、会统计、能识图、会报告” 五大核心专业能力,将成为上海规划和自然资源行业专业人员处理各类专业问题的 “AI 伙伴”。 作为全国规划资源领域首个基础大模型,云宇星空行业基座大模型打造了 “基座大模型 六大垂类模型” 的 “1 6” 模型体系,兼顾通用能力与行业深度,支撑复杂空间治理场景下的专业智能需求;同时围绕不同业务目标,搭建面向多领域、多任务的智能体体系。
中山大学王广润:大模型的微调只是对空间建模的微调 | GAIR 2025
相比于虚拟世界,真实的世界充斥着动态变化的环境变量和各种各样的物理规则,这要求基础模型不仅具备强大的感知与计算能力,更需拥有理解物理规律、预判场景变化的综合能力。 在此背景下,基础模型的能力边界不断被突破,而新一代AI架构与物理世界建模作为全球AI领域最核心的前沿探索方向之一,更是成为技术突破的关键抓手。 如何通过新一代AI架构的创新迭代,赋能物理世界建模的精准化、高效化,让AI更好地理解、建模并交互物理环境。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉