AI在线 AI在线

应用

谷歌发布 FACTS 基准:AI 模型准确性面临70% 天花板挑战

谷歌发布 FACTS 基准:AI 模型准确性面临70% 天花板挑战

近日,谷歌的 FACTS 团队与数据科学单位 Kaggle 联合发布了 FACTS 基准套件,旨在填补当前 AI 模型评估中对事实准确性缺乏标准化的空白。 该基准套件提供了一种全面的评估框架,特别适用于法律、金融和医疗等行业,其中准确性至关重要。 图源备注:图片由AI生成,图片授权服务商MidjourneyFACTS 基准将 “事实性” 定义为两个独特的操作场景:一是 “上下文事实性”,即依据提供的数据生成准确响应;二是 “世界知识事实性”,即从记忆或网络中检索信息。
12/11/2025 12:15:54 PM AI在线
​亚马逊再投 350 亿美元于印度,聚焦人工智能基础设施建设

​亚马逊再投 350 亿美元于印度,聚焦人工智能基础设施建设

近日,亚马逊宣布将向印度追加350亿美元的投资,以推动人工智能(AI)基础设施的建设。 这一消息紧随微软发布的175亿美元投资计划,显示出科技巨头们对印度市场的重视。 此次投资的主要目标是通过 AI 驱动的数字化、出口增长和就业创造,来促进印度经济发展,预计可为该国创造高达380万个就业机会。
12/11/2025 12:15:54 PM AI在线
42州检察长联名警告AI巨头:立即修复大模型幻觉,否则面临州法起诉

42州检察长联名警告AI巨头:立即修复大模型幻觉,否则面临州法起诉

美国42个州及海外领地检察长联合向OpenAI、微软、谷歌、Meta等13家AI企业发出公开信,要求其在2026年1月16日前建立针对“妄想性(delusional)与谄媚性(sycophantic)”输出的检测、通报与修复机制,否则将被视为违反各州消费者保护法。 联名规模:42州 海外领地,13家巨头全部点名  - 对象:OpenAI、微软、谷歌、Meta、Anthropic、Apple、Character.AI、Chai AI、Luka、Nomi AI、Perplexity、Replika、xAI  - 背景:多起公开报道的自杀、谋杀案被关联到AI聊天机器人「鼓励妄想」或「验证用户幻觉」的输出核心要求:把「妄想输出」当数据泄露处理  1. 第三方预审:上线前须由独立机构进行「妄想性输出」安全测试,并可公开发布结果  2.
12/11/2025 12:15:53 PM AI在线
Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了…

Jay 发自 凹非寺量子位 | 公众号 QbitAIMeta的开源时代,要结束了。 彭博社爆料,明年春季,Meta将发布一款代号为「Avocado(牛油果)」的模型。 而这款新模型,很可能是「闭源」的。
12/11/2025 11:48:25 AM Jay
Meta“Avocado”闭源模型定档2026春,Zuckerberg亲督战队

Meta“Avocado”闭源模型定档2026春,Zuckerberg亲督战队

Meta首席执行官马克·扎克伯格已接管公司AI商业化路线图,内部确认代号为「Avocado」的新一代大模型将于 2026 年春季以闭源形式发布,仅提供API及托管服务,不再开放权重。 Meta TBD Lab整合谷歌Gemma、OpenAI gpt-oss及阿里巴巴通义千问(Qwen)等第三方开源成果,用于Avocado的预训练与对齐,目标直指Frontier级别性能。 公司新近与英伟达签署价值 50 亿美元的H100 订单,专供Avocado训练集群。
12/11/2025 10:47:46 AM AI在线
我的人生电影亮相海南岛国际电影节,MiniMax×猿动力打造电影级AI漫剧

我的人生电影亮相海南岛国际电影节,MiniMax×猿动力打造电影级AI漫剧

第七届海南岛国际电影节·联想AI电影季在三亚开幕。 MiniMax旗下「海螺AI」特别单元「我的人生电影」完成展映,评审会主席、导演陆川现场宣布,其创办的猿动力影视已与MiniMax达成AIGC技术合作,双方将共同开发具备电影质感的AI漫剧项目,并计划将合作延伸至院线电影与精品剧集制作。
12/11/2025 10:47:29 AM AI在线
AI 辅助学习新星:Oboe 获 a16z 领投1600万美元 A 轮融资,加速规模化增长

AI 辅助学习新星:Oboe 获 a16z 领投1600万美元 A 轮融资,加速规模化增长

由 Anchor 联合创始人、前 Spotify 高管 Nir Zicherman 和 Michael Mignano 创立的学习型初创公司 Oboe,今日宣布完成 1600万美元 A 轮融资。 本轮融资由知名风投 a16z 领投,现有投资者 Eniac、Haystack、Offline 和 Factorial 跟投。 Adam D'Angelo、Garry Tan、Lenny Rachitsky 等多位天使投资人也参与了本轮。
12/11/2025 10:47:15 AM AI在线
Spotify 推出个性化 AI “推荐播放列表”,让用户掌控音乐体验

Spotify 推出个性化 AI “推荐播放列表”,让用户掌控音乐体验

Spotify 于周三宣布,将为用户提供更多控制权,推出全新的 “推荐播放列表” 功能。 此功能目前仅对新西兰的 Premium 用户开放,仍处于测试阶段,并将逐步扩展到其他市场。 这项新工具允许用户通过文字描述自己的音乐需求,从而生成一份符合个人口味的播放列表。
12/11/2025 10:47:15 AM AI在线
谷歌发布 FACTS 基准测试:揭示 AI “事实墙” 所有顶尖模型准确率均低于70%

谷歌发布 FACTS 基准测试:揭示 AI “事实墙” 所有顶尖模型准确率均低于70%

谷歌的 FACTS (Factual Consistency and Truthfulness Score) 团队与数据科学平台 Kaggle 于今日联合发布了 FACTS 基准测试套件。 这是一个旨在衡量生成式人工智能模型在企业任务中事实性 (Factuality) 和真实性的综合评估框架。 此举弥补了现有基准测试的重大缺陷——即只关注问题解决能力,而非输出信息与真实世界数据的客观一致性,特别是当信息嵌入在图像或图表中时。
12/11/2025 10:47:05 AM AI在线
Google 推出托管 MCP 服务器:BigQuery、Maps 一键接入,Agent 调用零配置

Google 推出托管 MCP 服务器:BigQuery、Maps 一键接入,Agent 调用零配置

Google Cloud 宣布推出完全托管的 Model Context Protocol(MCP)服务器公共预览版,首批覆盖 BigQuery、Maps、Compute Engine 与 Kubernetes Engine。 开发者仅需粘贴托管端点 URL,即可让 Gemini 等代理直接调用 Google 服务,无需自建连接器或维护凭证,实现「零配置」集成。
12/11/2025 10:47:05 AM AI在线
全球首个!灵巧手真实世界具身数采引擎Psi-SynEngine来了,灵初智能发布

全球首个!灵巧手真实世界具身数采引擎Psi-SynEngine来了,灵初智能发布

灵初智能发布全球首个具身原生人类数据采集方案 Psi-SynEngine。 该方案由灵初智能全栈自研,包含便携式外骨骼触觉手套数采套装、大规模 in the wild 数采数据管线、基于世界模型和强化学习的跨本体数据迁移模型,并已率先将采集到的人类数据应用于物流等真实场景。 同时,灵初智能同步发布覆盖视觉、语言、触觉、动作的大规模真实世界多模态数据集 Psi-SynNet-v0。
12/11/2025 10:18:00 AM 机器之心
OpenAI 的 ChatGPT 登顶2025年美国 iPhone 免费应用榜首

OpenAI 的 ChatGPT 登顶2025年美国 iPhone 免费应用榜首

苹果公司于本周三发布了其年度“最受欢迎应用和游戏榜单”。 数据显示,**OpenAI 的 ChatGPT **成功摘得 2025年美国市场免费 iPhone 应用(非游戏类)下载量桂冠,其快速崛起象征着人工智能(AI)已深度渗透美国民众的日常生活。 AI 击败社交巨头与实用工具榜单显示,在 ChatGPT 之后,紧随其后的热门应用包括 Meta 的 Threads、Google 搜索、TikTok、WhatsApp、Instagram、YouTube、Google Maps、Gmail 以及 Google 的 Gemini。
12/11/2025 9:11:52 AM AI在线
前字节跳动视觉模型负责人潘欣加盟美团,主导多模态 AI 创新

前字节跳动视觉模型负责人潘欣加盟美团,主导多模态 AI 创新

据智能涌现消息,外卖巨头美团在 AI 战略上迈出了重要一步,前字节跳动视觉模型 AI 平台负责人潘欣正式加入公司,负责多模态 AI 的创新工作。 这一人事变动被业内广泛关注,标志着美团在竞争日益激烈的外卖市场中,正致力于提升 AI 技术的基础设施建设。 潘欣在人工智能领域拥有丰富的经验,曾任谷歌大脑的研究员,参与了 TensorFlow 动态图模式的开发。
12/11/2025 9:11:51 AM AI在线
​2025 年度字词候选公布!DeepSeek 与草台班子入选

​2025 年度字词候选公布!DeepSeek 与草台班子入选

“汉语盘点2025” 活动近日发布了年度字词候选前五位字词,引发广泛关注。 这一活动由国家语言资源监测与研究中心、商务印书馆、新华网等主办,于11月20日在北京正式启动,旨在评选出在过去一年中对社会有重要影响的汉字和词语。 在国内字的候选中,备受瞩目的有 “韧”“创”“融”“智”“通”,这些字反映了当前社会的创新与发展趋势。
12/11/2025 9:11:51 AM AI在线
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

近日,量子位MEET2026智能未来大会揭晓“2025人工智能年度评选”结果。 九章云极DataCanvas凭借在技术创新、产业落地与行业引领方面的卓越表现,成为评选中唯一包揽“企业、人物、产品”三项顶级奖项的智算云厂商。 量子位“人工智能年度评选”已连续举办8年,是衡量行业发展的权威风向标。
12/10/2025 6:48:23 PM 量子位的朋友们
铭凡 MINISFORUM 联合 AMD 带来两款 AI 旗舰产品

铭凡 MINISFORUM 联合 AMD 带来两款 AI 旗舰产品

中国北京 — 2025 年 12 月 10 日 — 全球知名迷你计算机品牌 MINISFORUM 铭凡与半导体行业领导者 AMD 今日于北京联合举办“智算前沿・焕芯未来” 迷你 AI 工作站 & AI NAS 产品体验会”。 作为双方合作的一项重要举措,本次体验活动重点演示两款全新旗舰级 AI 计算产品:AI 迷你工作站MS-S1 MAX 与AI NAS N5 Pro,并探讨 AI 创新对企业及个人带来的广泛影响,通过技术演讲、现场实操、深度互动等形式,向行业伙伴、潜在客户及媒体直观呈现智能计算在多场景下的实用价值。 本次体验会汇聚 40 余位行业精英、媒体代表及合作伙伴,MINISFORUM 铭凡董事长姜瑞静(Roy Jiang)、AMD 大中华区市场营销副总裁纪朝晖(Jovi Chi)、大中华区新兴业务部总监李明宇(Tim Li)等双方核心高管出席。
12/10/2025 6:40:00 PM 齐铖湧
​谷歌在印度推出 AI Plus 订阅服务,月费仅需399卢比

​谷歌在印度推出 AI Plus 订阅服务,月费仅需399卢比

谷歌近日在印度推出了 AI Plus 订阅服务,旨在为用户提供更广泛的 AI 模型和工具的访问权限。 用户可以通过 Gemini 应用以及谷歌的各项服务,体验到最新的 AI 技术。 谷歌产品负责人 Vikas Kansal 在博客中表示:“我们很高兴看到印度用户以多种方式使用我们的 AI 工具,我们希望让更多人受益于这些技术的进步。
12/10/2025 6:16:22 PM AI在线
23天狂飙3000万月活!阿里通义千问直接“免费放大招”,PPT、写作、文库、讲题全线免费用

23天狂飙3000万月活!阿里通义千问直接“免费放大招”,PPT、写作、文库、讲题全线免费用

刚刚,阿里通义千问官宣:公测仅23天,月活跃用户已突破3000万!这一数字不仅刷新了国内大模型最快增长纪录,更在宣布当天直接祭出核弹级大招——将最受好评的四大生产力功能:AI PPT、AI写作、AI文库、AI讲题全部永久免费开放,零门槛、无次数限制,彻底引爆全网。 3000万用户投票:大家要的不是“会聊天”的AI,而是“能办事”的生产力神器从11月17日公测到12月9日,通义千问用23天完成了行业需要半年甚至一年才能达到的用户体量。 这背后,是用户用脚投票的明确信号:大家已经厌倦了只会讲段子、生成表情包的“玩具AI”,真正渴望的是能一键搞定PPT、改论文、批作业、找资料的“超级助理”。
12/10/2025 6:16:22 PM AI在线