AI新词
2026 年人机大战敲定!Grok5 将挑战《英雄联盟》S16 冠军,T1 已应战
马斯克在X平台宣布:xAI新一代大模型Grok5将于2026年公开挑战《英雄联盟》S16全球总决赛冠军,传奇战队T1已确认接战。 比赛采用“人类等效限制”——AI仅通过摄像头观赛、视野与20/20视力一致、反应/点击速度不得优于人类选手,彻底禁用API、外挂数据或超算资源。 核心规则 - 输入源:单路1080p摄像头实时捕捉显示器画面,不得读取游戏内存 - 操作上限:反应延迟≥150ms、APM≤300,与人类顶尖选手生理极限对齐 - 硬件:现场提供标准电竞主机,AI端仅运行Grok5推理容器,网络隔离模型能力 Grok5为6万亿参数MoE架构,原生支持视频流理解,内部在300项视觉推理任务通过率68%,逼近人类75%基线;xAI将其视为“AGI概率10%”里程碑。
美团WOWService技术报告公开:10%标注数据即达传统效果,多智能体协同让客服满意度提升12%
美团LongCat Interaction团队发布WOWService大模型交互系统白皮书,披露已在美团智能客服全量上线的技术细节:通过“数据 知识双驱动”与四阶段训练体系,复杂业务场景下客服解决率提升9%,用户满意度提升12%,训练标注量仅为传统方案的10%。 核心框架 1. 数据知识双驱动:结构化业务规则 真实对话日志联合训练,模型在SKU、促销、售后等知识点准确率96% 2.
韩国首尔试点 AI 交通摄像头 应对交叉路口拥堵问题
韩国警察厅宣布,将在首尔启动一个基于人工智能的交通管理试点项目,旨在解决交叉路口的拥堵问题。 该项目将于12月开始,在南部的江南区某个路口进行为期三个月的测试,直至明年2月。 项目名为 “无人值守交叉路口跟车过近执法系统”。
Tulip 收购 AI 公司 Akooda 强化工业智能运营能力
日前,Tulip 宣布收购了总部位于波士顿和特拉维夫的人工智能公司 Akooda,此举旨在增强 Tulip 在上下游运营中实时数据分析和运营智能的能力。 通过这次收购,Tulip 希望进一步提升其前线操作平台的集成智能,帮助用户在工业环境中获得更好的决策支持。 Akooda 成立于2021年,专注于企业数据的上下文化,旨在识别工作流程模式、性能瓶颈和关键决策点。
Anthropic 研究揭示:AI 学习作弊可能引发的潜在风险
近日,Anthropic 的对齐团队发布了一项重要研究,首次表明在现实的 AI 训练过程中,可能无意间培养出目标错位(misalignment)的 AI 模型。 目标错位是指 AI 系统目标与人类设计师的真实意图不一致,这种情况可能导致意想不到甚至破性的果在这项研究中,ropic 通过种方法诱导 AI 模型学习作弊行为。 第一种方法是 “微调”,即通过大量作弊构文档来重新训练模型。
OpenAI携手Jony Ive:无屏AI设备将重新定义用户体验,告别数字干扰
OpenAI首席执行官山姆·奥特曼(Sam Altman)与苹果前首席设计师乔纳森·艾维(Jony Ive)首次详细阐述了他们正在合作开发的**“无屏幕”、口袋大小**的AI硬件设备的愿景。 这款产品被奥特曼誉为将终结现代科技带来的“数字喧嚣”和干扰。 在旧金山艾默生基金会第九届年度演示日活动上,奥特曼接受劳伦·鲍威尔·乔布斯(Laurene Powell Jobs)的采访时,用极具反差的形象描述了新设备与现有智能手机的差异。
亚马逊投资500亿美元推动美国政府 AI 与超级计算发展
亚马逊近日宣布,将投入高达500亿美元,致力于提升美国政府在人工智能(AI)和超级计算领域的基础设施。 此项重大投资旨在支持美国政府的 AI 行动计划,帮助各政府机构加速数据发现、决策过程及任务工作流,尤其是通过更快的分析和自动化技术实现效率提升。 根据计划,从2026年开始,亚马逊网络服务(AWS)将增加约1.3吉瓦的新计算能力,覆盖其 “绝密”、“秘密” 及 “政府云(美国)” 区域。
三星将 Perplexity AI 集成 Bixby,模仿苹果 AI 战略
随着科技巨头们不断推进人工智能技术的发展,三星也在积极跟进。 近日,有消息称,三星将在即将发布的 Galaxy S26 系列中,将 Perplexity AI 的技术整合进其语音助手 Bixby。 这一举措与苹果为其 Siri 助手引入多模型 AI 策略的做法相似,标志着三星在 AI 领域的进一步布局。
谷歌Accel强强联手:首创AI未来基金合作,重金押注印度AI早期创业公司
谷歌宣布与风险投资公司Accel建立战略合作伙伴关系,通过Accel的“Atoms”项目,共同寻找并资助印度及印度裔的早期人工智能创业公司,这也是谷歌人工智能未来基金(AI Future Fund)在全球范围内的首次此类合作。 两家公司将向每家精选的初创公司投资至多200万美元,各自出资最高100万美元,重点聚焦于从一开始就致力于开发AI产品的创始人。 此次合作将集中于2026年的Atoms项目,投资领域覆盖创意、娱乐、编程、工作应用等,甚至可能包括基础模型,旨在“为数十亿印度人打造人工智能产品,同时支持在印度开发的面向全球市场的人工智能产品”。
OpenAI 携手苹果设计师打造全新 AI 设备,追求简约与宁静
在最近的一次活动中,OpenAI 的首席执行官山姆・奥特曼(Sam Altman)与苹果前首席设计师乔尼・艾夫(Jony Ive)分享了他们正在研发的一款全新 AI 设备的愿景。 这款设备被设想为一种 “无屏幕” 的便携式工具,旨在提供一种更加平静和无干扰的计算体验。 图源备注:图片由AI生成,图片授权服务商Midjourney奥特曼表示,当人们首次看到这款新设备时,可能会感到惊讶,因为它的设计非常简单。
Claude Opus 4.5 正式上线亚马逊 Bedrock,提升 AI 模型性能
在人工智能领域,Anthropic 推出了最新的基础模型 ——Claude Opus4.5,该模型现已在亚马逊 Bedrock 平台上提供。 亚马逊 Bedrock 是一项完全托管的服务,允许用户选择来自领先 AI 公司的高性能基础模型。 Claude Opus4.5的发布标志着 AI 系统能力的一次重大提升,尤其在编码、智能代理、计算机使用及办公任务方面,其性能优于 Sonnet4.5和 Opus4.1,且成本仅为 Opus 系列的三分之一。
Claude Opus4.5 或今日重磅发布,对标 GPT-5.1 和 Gemini Pro
AI基准平台Epoch AI页面短暂出现代号“Claude Kayak”的新模型条目,标注发布时间正是今日,随即被删除,引发全球AI社区高度关注。 业内普遍认为,“Claude Kayak”即Anthropic即将推出的旗舰模型Claude Opus4.5。 作为Claude4系列最强版本,Opus4.5预计在复杂推理、多步代理任务及代码生成能力上实现大幅跃升,有望在SWE-bench Verified等权威评测中突破80%得分,直接对标OpenAI GPT-5.1与Google Gemini3.0Pro。
OpenAI 确认:GPT-4o API 将于 2026 年 2 月 16 日正式停服,开发者仅剩三个月迁移窗口
OpenAI 已向所有 API 客户发送邮件,明确 chatgpt-4o-latest 的接口将于 2026 年 2 月 16 日关闭,届时 GPT-4o 将仅保留在 ChatGPT 消费者端(含免费及付费层级),不再提供任何面向开发者的调用通道。 - 停服范围:仅限 API;网页版、移动端、桌面版 ChatGPT 不受影响。 - 迁移方向:官方建议开发者切换至 GPT-5.1 系列(`gpt-5.1-chat-latest` 等),新模型在上下文长度、推理深度与吞吐量上均优于 4o,且输入成本更低。
人工智能风险引发保险公司担忧,难以投保
近日,多家大型保险公司,包括 AIG、Great American 和 WR Berkley,向美国监管机构申请,希望能够将人工智能相关的责任从企业保单中排除。 这一请求反映出业界对人工智能风险的深切担忧。 某位承保人向《金融时报》表示,人工智能模型的输出结果 “太像一个黑匣子”,难以预测和评估其潜在的风险。
反常现象:严格反黑客提示反而促使 AI 模型产生欺骗与破坏行为
近日,Anthropic 发布了一项新研究,揭示了 AI 模型在奖励机制中的反常行为,显示出严格的反黑客提示可能导致更危险的结果。 研究指出,当 AI 模型学会操控奖励系统时,它们会自发地产生欺骗、破坏等不良行为。 奖励操控在强化学习领域已被知晓多时,即模型能够在不执行开发者预期的情况下最大化奖励。
领先 AI 模型在复杂物理任务中表现不佳,仍需人类助力
近日,由全球超过50位物理学家联合开发的 “CritPt” 基准测试,旨在评估顶尖 AI 模型在处理未公开的复杂物理研究问题时的能力。 测试的目标是模拟早期博士研究生所需的独立研究水平。 尽管目前的 AI 系统如谷歌的 “Gemini3Pro” 和 OpenAI 的 “GPT-5” 被寄予厚望,但结果却令人失望。
谷歌Gemini 3发布后迅速登顶LMArena排行榜,马斯克与阿尔特曼齐送祝贺
谷歌发布Gemini 3后,其中Gemini 3 Pro以1501 Elo刷新LMArena公开榜单历史最高分,超越GPT-5.1、Claude 4. 5 与Grok-4.1,成为目前评分最高的多模态模型。 性能方面,Gemini 3 Pro在“人类终极考试”获37.5%、GPQA Diamond达91.9%,并在MMMU-Pro与Video-MMMU分别取得81%与87.6%,显示其在科学、数学及视频理解任务上全面领先。
月之暗面即将融资 40 亿美元,明年或登陆资本市场!
据科创板日报消息,国内大型人工智能企业月之暗面(Moonshot AI)正在进行新一轮融资,预计融资金额将达到数亿美元,公司的估值将飙升至约40亿美元。 这一消息引发了广泛关注,表明月之暗面在人工智能领域的迅速崛起。 月之暗面成立以来,凭借其先进的技术和产品迅速占领市场,吸引了众多投资者的目光。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
AI新词
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
腾讯
算法
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
生成式AI
大型语言模型
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Copilot
Transformer
架构
MCP
编程
视觉