应用
谷歌发布 FACTS 基准:AI 模型准确性面临70% 天花板挑战
近日,谷歌的 FACTS 团队与数据科学单位 Kaggle 联合发布了 FACTS 基准套件,旨在填补当前 AI 模型评估中对事实准确性缺乏标准化的空白。 该基准套件提供了一种全面的评估框架,特别适用于法律、金融和医疗等行业,其中准确性至关重要。 图源备注:图片由AI生成,图片授权服务商MidjourneyFACTS 基准将 “事实性” 定义为两个独特的操作场景:一是 “上下文事实性”,即依据提供的数据生成准确响应;二是 “世界知识事实性”,即从记忆或网络中检索信息。
亚马逊再投 350 亿美元于印度,聚焦人工智能基础设施建设
近日,亚马逊宣布将向印度追加350亿美元的投资,以推动人工智能(AI)基础设施的建设。 这一消息紧随微软发布的175亿美元投资计划,显示出科技巨头们对印度市场的重视。 此次投资的主要目标是通过 AI 驱动的数字化、出口增长和就业创造,来促进印度经济发展,预计可为该国创造高达380万个就业机会。
42州检察长联名警告AI巨头:立即修复大模型幻觉,否则面临州法起诉
美国42个州及海外领地检察长联合向OpenAI、微软、谷歌、Meta等13家AI企业发出公开信,要求其在2026年1月16日前建立针对“妄想性(delusional)与谄媚性(sycophantic)”输出的检测、通报与修复机制,否则将被视为违反各州消费者保护法。 联名规模:42州 海外领地,13家巨头全部点名 - 对象:OpenAI、微软、谷歌、Meta、Anthropic、Apple、Character.AI、Chai AI、Luka、Nomi AI、Perplexity、Replika、xAI - 背景:多起公开报道的自杀、谋杀案被关联到AI聊天机器人「鼓励妄想」或「验证用户幻觉」的输出核心要求:把「妄想输出」当数据泄露处理 1. 第三方预审:上线前须由独立机构进行「妄想性输出」安全测试,并可公开发布结果 2.
Meta公开抄阿里Qwen作业,还闭源了…
Jay 发自 凹非寺量子位 | 公众号 QbitAIMeta的开源时代,要结束了。 彭博社爆料,明年春季,Meta将发布一款代号为「Avocado(牛油果)」的模型。 而这款新模型,很可能是「闭源」的。
Meta“Avocado”闭源模型定档2026春,Zuckerberg亲督战队
Meta首席执行官马克·扎克伯格已接管公司AI商业化路线图,内部确认代号为「Avocado」的新一代大模型将于 2026 年春季以闭源形式发布,仅提供API及托管服务,不再开放权重。 Meta TBD Lab整合谷歌Gemma、OpenAI gpt-oss及阿里巴巴通义千问(Qwen)等第三方开源成果,用于Avocado的预训练与对齐,目标直指Frontier级别性能。 公司新近与英伟达签署价值 50 亿美元的H100 订单,专供Avocado训练集群。
我的人生电影亮相海南岛国际电影节,MiniMax×猿动力打造电影级AI漫剧
第七届海南岛国际电影节·联想AI电影季在三亚开幕。 MiniMax旗下「海螺AI」特别单元「我的人生电影」完成展映,评审会主席、导演陆川现场宣布,其创办的猿动力影视已与MiniMax达成AIGC技术合作,双方将共同开发具备电影质感的AI漫剧项目,并计划将合作延伸至院线电影与精品剧集制作。
AI 辅助学习新星:Oboe 获 a16z 领投1600万美元 A 轮融资,加速规模化增长
由 Anchor 联合创始人、前 Spotify 高管 Nir Zicherman 和 Michael Mignano 创立的学习型初创公司 Oboe,今日宣布完成 1600万美元 A 轮融资。 本轮融资由知名风投 a16z 领投,现有投资者 Eniac、Haystack、Offline 和 Factorial 跟投。 Adam D'Angelo、Garry Tan、Lenny Rachitsky 等多位天使投资人也参与了本轮。
Spotify 推出个性化 AI “推荐播放列表”,让用户掌控音乐体验
Spotify 于周三宣布,将为用户提供更多控制权,推出全新的 “推荐播放列表” 功能。 此功能目前仅对新西兰的 Premium 用户开放,仍处于测试阶段,并将逐步扩展到其他市场。 这项新工具允许用户通过文字描述自己的音乐需求,从而生成一份符合个人口味的播放列表。
谷歌发布 FACTS 基准测试:揭示 AI “事实墙” 所有顶尖模型准确率均低于70%
谷歌的 FACTS (Factual Consistency and Truthfulness Score) 团队与数据科学平台 Kaggle 于今日联合发布了 FACTS 基准测试套件。 这是一个旨在衡量生成式人工智能模型在企业任务中事实性 (Factuality) 和真实性的综合评估框架。 此举弥补了现有基准测试的重大缺陷——即只关注问题解决能力,而非输出信息与真实世界数据的客观一致性,特别是当信息嵌入在图像或图表中时。
Google 推出托管 MCP 服务器:BigQuery、Maps 一键接入,Agent 调用零配置
Google Cloud 宣布推出完全托管的 Model Context Protocol(MCP)服务器公共预览版,首批覆盖 BigQuery、Maps、Compute Engine 与 Kubernetes Engine。 开发者仅需粘贴托管端点 URL,即可让 Gemini 等代理直接调用 Google 服务,无需自建连接器或维护凭证,实现「零配置」集成。
全球首个!灵巧手真实世界具身数采引擎Psi-SynEngine来了,灵初智能发布
灵初智能发布全球首个具身原生人类数据采集方案 Psi-SynEngine。 该方案由灵初智能全栈自研,包含便携式外骨骼触觉手套数采套装、大规模 in the wild 数采数据管线、基于世界模型和强化学习的跨本体数据迁移模型,并已率先将采集到的人类数据应用于物流等真实场景。 同时,灵初智能同步发布覆盖视觉、语言、触觉、动作的大规模真实世界多模态数据集 Psi-SynNet-v0。
OpenAI 的 ChatGPT 登顶2025年美国 iPhone 免费应用榜首
苹果公司于本周三发布了其年度“最受欢迎应用和游戏榜单”。 数据显示,**OpenAI 的 ChatGPT **成功摘得 2025年美国市场免费 iPhone 应用(非游戏类)下载量桂冠,其快速崛起象征着人工智能(AI)已深度渗透美国民众的日常生活。 AI 击败社交巨头与实用工具榜单显示,在 ChatGPT 之后,紧随其后的热门应用包括 Meta 的 Threads、Google 搜索、TikTok、WhatsApp、Instagram、YouTube、Google Maps、Gmail 以及 Google 的 Gemini。
前字节跳动视觉模型负责人潘欣加盟美团,主导多模态 AI 创新
据智能涌现消息,外卖巨头美团在 AI 战略上迈出了重要一步,前字节跳动视觉模型 AI 平台负责人潘欣正式加入公司,负责多模态 AI 的创新工作。 这一人事变动被业内广泛关注,标志着美团在竞争日益激烈的外卖市场中,正致力于提升 AI 技术的基础设施建设。 潘欣在人工智能领域拥有丰富的经验,曾任谷歌大脑的研究员,参与了 TensorFlow 动态图模式的开发。
2025 年度字词候选公布!DeepSeek 与草台班子入选
“汉语盘点2025” 活动近日发布了年度字词候选前五位字词,引发广泛关注。 这一活动由国家语言资源监测与研究中心、商务印书馆、新华网等主办,于11月20日在北京正式启动,旨在评选出在过去一年中对社会有重要影响的汉字和词语。 在国内字的候选中,备受瞩目的有 “韧”“创”“融”“智”“通”,这些字反映了当前社会的创新与发展趋势。
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局
近日,量子位MEET2026智能未来大会揭晓“2025人工智能年度评选”结果。 九章云极DataCanvas凭借在技术创新、产业落地与行业引领方面的卓越表现,成为评选中唯一包揽“企业、人物、产品”三项顶级奖项的智算云厂商。 量子位“人工智能年度评选”已连续举办8年,是衡量行业发展的权威风向标。
铭凡 MINISFORUM 联合 AMD 带来两款 AI 旗舰产品
中国北京 — 2025 年 12 月 10 日 — 全球知名迷你计算机品牌 MINISFORUM 铭凡与半导体行业领导者 AMD 今日于北京联合举办“智算前沿・焕芯未来” 迷你 AI 工作站 & AI NAS 产品体验会”。 作为双方合作的一项重要举措,本次体验活动重点演示两款全新旗舰级 AI 计算产品:AI 迷你工作站MS-S1 MAX 与AI NAS N5 Pro,并探讨 AI 创新对企业及个人带来的广泛影响,通过技术演讲、现场实操、深度互动等形式,向行业伙伴、潜在客户及媒体直观呈现智能计算在多场景下的实用价值。 本次体验会汇聚 40 余位行业精英、媒体代表及合作伙伴,MINISFORUM 铭凡董事长姜瑞静(Roy Jiang)、AMD 大中华区市场营销副总裁纪朝晖(Jovi Chi)、大中华区新兴业务部总监李明宇(Tim Li)等双方核心高管出席。
谷歌在印度推出 AI Plus 订阅服务,月费仅需399卢比
谷歌近日在印度推出了 AI Plus 订阅服务,旨在为用户提供更广泛的 AI 模型和工具的访问权限。 用户可以通过 Gemini 应用以及谷歌的各项服务,体验到最新的 AI 技术。 谷歌产品负责人 Vikas Kansal 在博客中表示:“我们很高兴看到印度用户以多种方式使用我们的 AI 工具,我们希望让更多人受益于这些技术的进步。
23天狂飙3000万月活!阿里通义千问直接“免费放大招”,PPT、写作、文库、讲题全线免费用
刚刚,阿里通义千问官宣:公测仅23天,月活跃用户已突破3000万!这一数字不仅刷新了国内大模型最快增长纪录,更在宣布当天直接祭出核弹级大招——将最受好评的四大生产力功能:AI PPT、AI写作、AI文库、AI讲题全部永久免费开放,零门槛、无次数限制,彻底引爆全网。 3000万用户投票:大家要的不是“会聊天”的AI,而是“能办事”的生产力神器从11月17日公测到12月9日,通义千问用23天完成了行业需要半年甚至一年才能达到的用户体量。 这背后,是用户用脚投票的明确信号:大家已经厌倦了只会讲段子、生成表情包的“玩具AI”,真正渴望的是能一键搞定PPT、改论文、批作业、找资料的“超级助理”。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉