应用
阿里通义发布端到端语音交互模型 Fun-Audio-Chat,能猜出你的心情
AI在线 12 月 23 日消息,阿里通义大模型今日发布了新一代端到端语音交互模型 Fun-Audio-Chat。 阿里通义本次开源了 Fun-Audio-Chat 8B,该模型在 OpenAudioBench、MMAU、Speech-ACEBench、VStyle 等多个榜单上“同尺寸模型排名第一”,综合性能超 GLM4-Voice、Kimi-Audio、Baichuan-Omni 等。 AI在线附 Fun-Audio-Chat 技术亮点如下:端到端 S2S 架构:从语音输入直接生成语音输出,无需 ASR LLM TTS 多模块拼接,效率更高、延迟更低。
钉钉推出专为企业打造的 AI 硬件 DingTalk Real
在2AI 钉钉1.1新品发布暨生态大会上,钉钉正式推出了一款名为 DingTalk Real 的企业级 AI 硬件。 官方表示,这款硬件旨在为企业提供全新的智能终端,改变传统设备为人服务的模式,专注于为企业中的 “Agent” 角色提供支持。 DingTalk Real 被设计为一个 AgentOS 执行终端,其核心功能包括 Real Entity、Real Data 和 Real Time,能够在企业内部网络中高效运作。
英伟达云业务战略调整:重心转向内部 AI 开发
英伟达在其 CEO 黄仁勋的领导下,逐步调整了云业务的战略方向,日前宣布对云业务团队进行重组。 根据内部备忘录和知情人士的消息,这一变动意味着英伟达将不再积极与大型云服务商如亚马逊 AWS 展开竞争,而是将重心放在内部 AI 开发上。 新任命的高管 Alexis Black Bjorlin 于2023年从 Meta 加入英伟达,将在新的职位上推动云团队的整合。
微软纳德拉重返一线督战,Copilot付费增长为何陷入瓶颈?
近日,微软内部正经历一场由CEO萨提亚·纳德拉亲自带队的“AI保卫战”。 据知情人士透露,由于不满旗下AI助手Copilot的表现,纳德拉已大幅调整个人工作重心,从管理日常商业事务转向深入技术一线,甚至直接在工程师群组中“拷问”产品细节。 纳德拉的焦虑并非空穴来风。
上海市新增12款已完成备案的生成式人工智能服务
上海市网信办联合相关部门发布了最新的生成式人工智能服务备案信息公告,以推动本市生成式人工智能的创新与规范应用,助力上海建设成为人工智能发展高地。 根据《生成式人工智能服务管理暂行办法》,上海市已逐步开展了生成式人工智能服务的备案工作,现将已备案信息进行公布。 截至12月23日,上海市新增了12款已完成备案的生成式人工智能服务,使得总备案数量达到了128款。
生数科技与清华大学联合推出 TurboDiffusion 视频生成加速框架
近日,生数科技与清华大学的 TSAIL 实验室共同发布了一个名为 TurboDiffusion 的视频生成加速框架,并将其开源。 这个新框架的发布引起了广泛关注,许多人期待它能为视频生成技术带来突破性进展。 根据官方介绍,TurboDiffusion 在几乎不影响生成质量的情况下,能够实现最高达200倍的视频生成推理加速。
都是TOP人才!跑遍全球,和机器之心共聚AI学术顶会
2025 年,AI 依然在加速奔跑。 从多模态大模型到智能体系统的演进,从基础理论的突破到产业应用的深化,技术的每一次跃迁,都在重塑未来的轮廓。 在海量学术成果爆发的背景下,单纯的阅读已难以追赶技术的迭代速度,我们笃信——再强大的算法,也需要人与人的连接;再前沿的突破,也需要面对面的对话。
智明堂大模型获国家中医执业医师测试最佳成绩,首创TCM-Eval基准促行业标准化
2025年12月20日,北京智明堂科技有限公司联合北京航空航天大学、原广州中医药大学博士生导师佘世锋教授团队、北京知言吉智科技有限公司正式发布自主研发的“智明堂”中医大语言模型ZMT-M1。 该大模型在近期国家中医执业医师资格考试模拟测试中,以96.26的高分斩获迄今该领域最佳成绩,远超其它已公开宣布的大模型。 同时,团队正式推出全球首个动态可扩展的中医大模型评测基准 TCM-Eval 及测试平台(),为中医大模型提供了公开、透明的竞技平台。
华为数据存储、中科弘云发布 AI 推理加速联合解决方案,适配英伟达、昇腾、寒武纪等算力
AI在线 12 月 23 日消息,华为数据存储与中科弘云今日发布了 AI 推理加速联合解决方案。 该方案以华为 OceanStor A 系列存储为数据底座,结合中科弘云智算互联网云服务平台 HyperCN 平台,优化长序列推理体验。 该方案深度融合华为 OceanStor A 系列存储、华为 UCM 推理记忆数据管理技术以及中科弘云 HyperCN 平台能力,通过 KV Cache 多级缓存管理、秒级算力调度、分钟级推理大模型部署及全流程 AI 工具链,将智能算力输送至业务一线。
宇树科技获交互控制专利授权,机器人响应速度大幅提升
据 AIbase 报道,国产机器人领军企业宇树科技(Unitree)近日在提升机器人“大脑”决策能力上取得关键突破。 企查查信息显示,宇树科技申请的“一种基于扩散策略的机器人交互控制方法和服务器”专利已正式获得授权。 该专利旨在解决现有机器人模型因缺乏对未来状态准确认知而导致的动作理解偏差问题。
印度数据中心快速发展面临人才短缺挑战
印度的数据中心行业正在经历快速增长,预计在本十年内其容量将翻倍。 然而,这一快速发展的行业正面临着人才短缺的问题,尤其是在满足实际运营需求方面,许多毕业生难以跟上行业的发展步伐。 数据中心在现代数字经济中扮演着至关重要的角色,支持着从云计算到人工智能等各种技术的运作。
从红包大战到 AI 对决:火山引擎或成为2026春晚独家合作伙伴
互联网巨头字节跳动正试图复制当年微信、支付宝的“破局”神话。 据《晚点 LatePost》独家爆料,字节跳动旗下的火山引擎已正式敲定成为2026年中央广播电视总台春节联欢晚会的独家 AI 云合作伙伴,旗下智能助手“豆包”也将深度参与,上线多种 AI 互动玩法。 作为国民级超级 IP,春晚历来是顶级互联网产品谋求爆发式增长的关键战场。
AI日报:智谱发布开源编程大模型GLM-4.7;豆包或成为2026春晚AI合作伙伴;ChatGPT 推出年终回顾功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:、ChatGPT 版“Spotify Wrapped”来了!测测你的年度 AI 称号是什么?OpenAI 推出年度回顾功能,类似 Spotify Wrapped,为用户提供个性化使用轨迹报告,并根据对话习惯授予特定称号,同时定制专属内容。 【AiBase提要:】🧠 与 ChatGPT 共度一年功能为用户提供个性化使用轨迹报告。
加速端侧大模型进化:面壁智能获数亿元新融资,深度布局智能座舱与终端生态
国内领先的大模型初创企业面壁智能宣布完成数亿元人民币的新一轮融资。 本轮投资方阵容强大,包括京国瑞、国科投资、中金保时捷基金、米聚资本及和基投资。 据了解,本轮募集资金将核心用于持续加大在端侧高效大模型领域的研发投入,进一步巩固其在终端智能市场的技术领先地位。
谷歌 DeepMind 发布 Gemma Scope 2:为 Gemma 3 模型提供全栈可解释性工具
谷歌 DeepMind 的研究团队近日推出了 Gemma Scope2,这是一个开放的可解释性工具套件,旨在深入了解 Gemma3语言模型在各层次上的信息处理和表现,涵盖从2.7亿到270亿参数的模型。 该工具的核心目标是为人工智能安全与对齐团队提供一种实用的方法,以便追踪模型行为回到内部特征,而不仅仅依赖输入与输出的分析。 当 Gemma3模型出现 “越狱”、幻觉或表现出拍马屁的行为时,研究人员可以利用 Gemma Scope2检查哪些内部特征被激活以及这些激活在网络中的流动情况。
LeCun和哈萨比斯「吵」起来了:「通用智能」到底存不存在?
今天 AI 圈最大的热闹莫过于 LeCun 和哈萨比斯在推上「吵」了起来。 事情的起因,源于 Yann LeCun 最近的一次「火力全开」。 前段时间,一位博主发布了一段 LeCun 的访谈剪辑,LeCun 在播客节目中表示:「通用智能」不存在,是彻头彻尾的胡说八道。
MiniMax Agent 平台上线开源编码和代理模型 MiniMax M2.1
MiniMax M2.1正式上线。 这款模型专为真实编码和原生 AI 组织设计,能够轻松应对从氛围构建到严肃工作流程的各种需求。 MiniMax M2.1是一款拥有100亿激活量的 SOTA(最先进技术)开源编码和代理模型,其在 SWE-multilingual 测试中得分72.5%,而在新发布的 VIBE-bench 测试中更是取得了88.6% 的高分,超越了 Gemini3Pro 和 Claude4.5Sonnet 等多款领先的闭源模型。
国产大模型首登顶!文心5.0 Preview在LMArena全球竞技场拿下中国最高分
近日,全球公认的大模型“竞技场”LMArena发布了最新的模型排名。 根据AIbase获悉的最新数据显示,百度新一代模型ERNIE-5.0-Preview-1203凭借1451的高分正式登上文本榜单。 值得关注的是,这一成绩使其成功问鼎国内大模型第一的宝座,标志着国产原生大模型在国际主流测评体系中取得了里程碑式的突破。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉