资讯列表

分类

标签

港中文 MMlab×美团新研究：仅用一个模型，应对多种视觉推理任务

在大模型迈向通用视觉智能的浪潮中，单一任务或单一模态的方法正面临瓶颈。现实世界的视觉理解系统不仅要回答问题，还要理解动态视频、定位事件、跟踪目标、生成描述乃至进行复杂的逻辑推理，这要求模型具备综合的跨任务和跨模态能力。然而，现有方法多数依赖任务专化模型，难以实现不同视觉任务间的协同与知识共享，这不仅导致系统复杂度高，也限制了模型在综合推理场景中的表现。

12/17/2025 11:09:00 AM 郑佳美

Google 推出个性化 AI 助手 CC，助你轻松管理晨间事务

Google 最近推出了一款名为 CC 的实验性 AI 助手，旨在改变用户早晨的忙碌状态。这个助手每天早晨会主动为用户整理邮件、日历和文档信息，并将其以个性化的 “日程前瞻” 简报形式发送到用户的邮箱。 CC 的设计理念是让用户在醒来后，不再被繁杂的信息轰炸，而是通过一份清晰的概览来开始新的一天。

12/17/2025 11:02:46 AM AI在线

豆包手机助手 nubia M153工程机首批售罄，F 码申请紧急停止

由字节跳动旗下 AI 大模型“豆包”驱动的“豆包手机助手”于12月初上线，并与中兴通讯合作推出了 nubia M153 工程机。这款具备跨应用语音操作能力（如自动完成比价并跳转下单）的新机迅速在科技圈引发抢购热潮。官方近日发布声明称，市场对豆包手机助手的热情“超乎想象”，合作方 nubia 基于技术预览少量备货的首批 M153手机，目前已完全无法满足已申请的 F 码需求。

12/17/2025 11:02:45 AM AI在线

红帽收购 AI 公司 Chatterbox Labs 强化企业级 AI 安全能力

红帽（Red Hat）近期宣布收购了一家名为 Chatterbox Labs 的人工智能公司，此次收购是为了进一步增强其在企业级 AI 领域的布局。 Chatterbox Labs 成立于2011年，专注于 AI 模型测试和生成式 AI 的安全防护。此次收购是继去年收购 Neural Magic 后，红帽再次加大在 AI 领域的投资。

12/17/2025 11:02:44 AM AI在线

Meta AI 眼镜重磅升级:新增“对话聚焦”和 Spotify 视觉配乐功能

Meta 公司周二宣布对其 Ray-Ban Meta 和 Oakley Meta HSTN 智能眼镜进行软件更新（v21），推出了两项关键新功能:“对话聚焦”以增强嘈杂环境中的听力清晰度，以及与 Spotify 合作的“视觉配乐”功能。实用功能上线:AI 增强嘈杂环境中的对话清晰度本次更新中最具实用性的功能是**“对话聚焦”（Conversation Focus）。该功能利用 AI 眼镜的开放式扬声器和人工智能技术，能够放大对话者的声音**，从而帮助用户在嘈杂的环境，如繁忙的餐厅、酒吧或通勤列车中，更清晰地听到对方说话。

12/17/2025 11:02:43 AM AI在线

小米开源3090亿参数MiMo-V2-Flash大模型，推理速度碾压主流竞品，API低至0.1美元/百万Token

小米正式进军高性能开源大模型赛道。近日，公司发布了全新基础语言模型 MiMo-V2-Flash，并同步以 MIT协议全面开源模型权重与推理代码。该模型以“超高速、高效率”为核心卖点，在推理、代码生成与智能体任务中表现尤为突出，实测响应速度甚至超越当前热门的豆包、DeepSeek和元宝等国产模型，引发开发者社区广泛关注。

12/17/2025 11:02:38 AM AI在线

DoorDash 推出 Zesty：新 AI 社交应用助你轻松发现本地餐厅

近日，DoorDash 宣布推出一款名为 Zesty 的新型 AI 社交应用，旨在帮助用户快速找到附近的餐厅。目前，该应用在旧金山湾区和纽约市率先上线。 DoorDash 此次扩展服务范围，超越了传统的外卖配送，致力于在社交和餐饮发现领域开辟新天地。

12/17/2025 11:02:38 AM AI在线

DoorDash 推出 AI 社交应用 Zesty:无需评论，即刻发现周边餐厅

外卖巨头 DoorDash 正式推出一款名为 Zesty 的全新 AI 社交应用。该应用旨在革新用户发现本地餐厅的方式，通过个性化的人工智能聊天和社交分享功能，帮助用户跳过冗长评论和搜索，快速找到心仪的用餐地点。 AI 驱动的美食发现新范式Zesty 应用的理念是超越传统的外卖和搜索模式，将 DoorDash 的业务范围拓展至社交和美食发现领域。

12/17/2025 11:02:38 AM AI在线

谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现

谷歌最近发布了 Gemini2.5Flash Native Audio 的更新，显著增强了其语音助手的功能。这一版本旨在更好地处理复杂的工作流程，提高执行用户指令的准确性，同时使对话更加自然流畅。根据谷歌的反馈，新版本在开发者指令的遵循率上从84% 提升至90%，这表明语音助手在理解和执行用户请求方面有了显著进步。

12/17/2025 11:02:38 AM AI在线

Mozilla 任命新 CEO，Firefox 将变身现代 AI 浏览器

Mozilla 公司近日宣布，任命 Anthony Enzor-DeMeo 为新任首席执行官，接替临时 CEO Laura Chambers。 Enzor-DeMeo 曾于2004至2005年担任 Firefox 的高级副总裁，近期则是 Mozilla Firefox 的总经理。他在担任 CEO 的第一天发布了公开信，阐述了未来 Mozilla 的发展方向。

12/17/2025 11:02:38 AM AI在线

DoorDash推AI社交新应用Zesty：用聊天找餐厅，把美食发现变成社交体验

外卖巨头DoorDash正悄然跳出“送餐”边界，杀入本地生活发现与社交赛道。公司近日在旧金山湾区和纽约试点推出全新AI驱动社交应用 Zesty，旨在让用户“不用翻遍点评、菜单或TikTok”，仅通过自然语言对话，就能快速找到心仪餐厅。 Zesty的核心是一套深度个性化的AI推荐引擎。

12/17/2025 11:02:25 AM AI在线

Gemini预测市场全美上线： 50 州用户可实时交易现实事件，免手续费限时开放

加密货币交易所Gemini正式将旗下预测市场产品 Gemini Predictions推向全美——现已在美国全部50个州开放运营。该平台允许用户围绕真实世界事件（如选举结果、经济数据、体育赛事、科技发布等）进行预测性交易，以“事件是否会发生”为标的，实现近乎即时的订单撮合与完全透明的市场数据。 Gemini强调，Predictions 基于合规框架构建，所有交易均在受监管环境中运行。

12/17/2025 11:02:08 AM AI在线

日本科学家发布“Sui”编程语言，宣称能让 LLM100% 准确编写代码

日本数据科学家 Takato Honda （本田崇人）近日推出了一门全新的开源编程语言 “Sui”(粋)，旨在革命性地解决大型语言模型(LLM)编写代码的准确性问题，并宣称能让 LLM 以100% 的准确率生成代码。据悉，该语言的名称源于日本美学中的 “粋”，意为**“精炼”和“去除冗余”，其设计理念是只保留必需品。 Sui 的核心设计原则包括:结构上保证零语法错误率**;通过使用数字作为变量而非名称，实现零拼写错误;保证行级独立性，即每一行代码都是完全独立的;它被设计为一门纯逻辑语言，仅用于计算，用户界面可以自由搭配任何现有框架（如 React、Vue 等）来实现。

12/17/2025 11:02:08 AM AI在线

报道称麦肯锡或将裁员数千人，AI 助力公司内部变革

近日，有消息传出咨询巨头麦肯锡正在考虑裁员，可能涉及数千个职位。这一决定的背景是，随着人工智能技术的快速发展，公司希望提高运营效率。在公司庆祝成立100周年之际，麦肯锡发言人表示:“我们正在经历一个由快速的 AI 进步所塑造的时代，这不仅影响了业务，也改变了社会。

12/17/2025 11:02:07 AM AI在线

OpenAI深夜放大招：GPT Image 1. 5 免费开放，生成速度提升 4 倍，奥特曼晒“男模照”引爆网络

OpenAI再次搅动AI图像生成赛道。今日凌晨，公司正式发布全新图像模型 GPT Image 1.5，并宣布向所有免费ChatGPT用户开放使用——无需付费订阅，即可体验目前最先进的文生图能力。新模型相较上一代GPT Image1 实现四大关键升级： - 指令遵循更精准：能准确理解复杂、多条件的提示词； - 编辑控制更精细：局部修改不再破坏整体构图； - 细节保留更完整：人物五官、纹理、光影一致性显著提升； - 生成速度提升 4 倍：大幅缩短用户等待时间。

12/17/2025 11:02:07 AM AI在线

艾伦人工智能研究所推出 Molmo 2 开源视频语言模型

近日，艾伦人工智能研究所（Ai2）发布了全新的 Molmo2开源视频语言模型。这一系列新模型和相关训练数据展示了该非营利机构在开源领域的坚定承诺，特别是在企业希望掌控模型使用的背景下，这无疑是一项重大利好。 Molmo2包含几种不同的模型版本，包括基于阿里巴巴 Qwen3语言模型的 Molmo2-4B 和 Molmo2-8B，此外还有基于 Ai2Olmo 语言模型的完全开源版本 Molmo2-O-7B。

12/17/2025 11:02:02 AM AI在线

阿布扎比 G42推出87亿参数的开源印英语言模型 NANDA87B

阿布扎比的人工智能集团 G42于周二正式发布了 NANDA87B，这是一款拥有87亿参数的开源印英大型语言模型，标志着其早期版本 NANDA 的升级。 NANDA87B 现已在 MBZUAI 的 Hugging Face 页面上以开放权重的形式提供，开发者、创作者和企业可以自由使用并扩展其功能。这款模型由穆罕默德・本・扎耶德人工智能大学（MBZUAI）与 G42旗下的 Inception 公司及芯片制造商 Cerebras 合作开发。

12/17/2025 11:02:02 AM AI在线

OpenAI聘英国前财长奥斯本掌舵“星际之门”全球扩张， 50 国正洽谈“主权AI”合作

在AI地缘竞争愈演愈烈的背景下，OpenAI正加速其全球战略布局。公司近日宣布，任命英国前财政大臣乔治·奥斯本（George Osborne）出任 “OpenAI for Countries” 负责人，全面主导其价值5000亿美元的“星际之门”(Starlink-scale infrastructure，注:此处“星际之门”应指超大规模AI基础设施计划，非SpaceX星链)计划的海外扩展。值得注意的是，这一人事任命紧随其主要竞争对手Anthropic于今年10月聘请英国前首相里希·苏纳克（Rishi Sunak）担任顾问之后，凸显AI巨头正将政治人脉与国家关系纳入核心竞争维度。

12/17/2025 11:02:02 AM AI在线

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

资讯列表

港中文 MMlab×美团新研究：仅用一个模型，应对多种视觉推理任务

Google 推出个性化 AI 助手 CC，助你轻松管理晨间事务

豆包手机助手 nubia M153工程机首批售罄，F 码申请紧急停止

​红帽收购 AI 公司 Chatterbox Labs 强化企业级 AI 安全能力

Meta AI 眼镜重磅升级:新增“对话聚焦”和 Spotify 视觉配乐功能

小米开源3090亿参数MiMo-V2-Flash大模型，推理速度碾压主流竞品，API低至0.1美元/百万Token

DoorDash 推出 Zesty：新 AI 社交应用助你轻松发现本地餐厅

DoorDash 推出 AI 社交应用 Zesty:无需评论，即刻发现周边餐厅

​谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现

Mozilla 任命新 CEO，Firefox 将变身现代 AI 浏览器

​DoorDash推AI社交新应用Zesty：用聊天找餐厅，把美食发现变成社交体验

​Gemini预测市场全美上线： 50 州用户可实时交易现实事件，免手续费限时开放

日本科学家发布“Sui”编程语言，宣称能让 LLM100% 准确编写代码

​报道称麦肯锡或将裁员数千人，AI 助力公司内部变革

​OpenAI深夜放大招：GPT Image 1. 5 免费开放，生成速度提升 4 倍，奥特曼晒“男模照”引爆网络

​艾伦人工智能研究所推出 Molmo 2 开源视频语言模型

阿布扎比 G42推出87亿参数的开源印英语言模型 NANDA87B

​OpenAI聘英国前财长奥斯本掌舵“星际之门”全球扩张， 50 国正洽谈“主权AI”合作

红帽收购 AI 公司 Chatterbox Labs 强化企业级 AI 安全能力

谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现

DoorDash推AI社交新应用Zesty：用聊天找餐厅，把美食发现变成社交体验

Gemini预测市场全美上线： 50 州用户可实时交易现实事件，免手续费限时开放

报道称麦肯锡或将裁员数千人，AI 助力公司内部变革

OpenAI深夜放大招：GPT Image 1. 5 免费开放，生成速度提升 4 倍，奥特曼晒“男模照”引爆网络

艾伦人工智能研究所推出 Molmo 2 开源视频语言模型

OpenAI聘英国前财长奥斯本掌舵“星际之门”全球扩张， 50 国正洽谈“主权AI”合作