AI在线 AI在线

大模型

​耐力惊人!Anthropic 旗舰模型 Claude Opus4.5创下“长任务”处理新纪录

​耐力惊人!Anthropic 旗舰模型 Claude Opus4.5创下“长任务”处理新纪录

在追求大模型“高智商”的同时,AI 的持续执行能力正成为衡量其进化水平的新维度。 根据人工智能研究机构METR发布的最新基准测试,Anthropic 旗下的顶级模型Claude Opus4.5在处理超长时间任务方面展现出了统治级实力。 测试结果显示,Claude Opus4.5在维持50% 成功率的前提下,能够持续处理长达约 4小时49分钟 的复杂任务,这一表现刷新了行业历史记录。
12/22/2025 12:21:31 PM AI在线
Agent成AI新核心!火山引擎推AgentKit,谭待:未来计算单元将从App转向智能体

Agent成AI新核心!火山引擎推AgentKit,谭待:未来计算单元将从App转向智能体

大模型竞赛正从“能力比拼”迈向“落地攻坚”。 在近日举行的火山引擎Force原动力大会上,火山引擎总裁谭待首次系统阐述AI演进新范式:智能Agent(智能体)将成为AI落地的核心载体,而多模态能力与高效Agent开发体系,正是打通技术与产业的最后一公里。 从“聊天”到“干活”:大模型进入复杂场景攻坚期谭待指出,过去大模型多用于问答式交互,如今已深入汽车、制造、餐饮等高复杂度行业。
12/22/2025 9:27:10 AM AI在线
火山引擎总裁谭待:大模型市场不是零和博弈,明年市场可能还要再涨十倍

火山引擎总裁谭待:大模型市场不是零和博弈,明年市场可能还要再涨十倍

12 月 18 日消息,今日,火山引擎在 FORCE 原动力大会期间,当被问及豆包大模型今年整体的成绩如何时,火山引擎总裁谭待表示,整体成绩肯定还可以,在国内肯定还是很明显的,但如果看全球的话,不论是 OpenAI 还是 Gemini,其实都非常好,所以我们在这一块还是要更加努力,当然我们的 Seedance 和 Seedream 在全球的表现也不错。 谈及 2026 年大模型市场的竞争,谭待表示,首先最重要的还不是竞争,最重要的是把市场做大,就是说你想明年市场可能还要再涨十倍,那大家看的就不是存量的竞争,不是说零和博弈。
12/18/2025 3:53:52 PM 罗宁
​谷歌祭出“降维打击”:Gemini 3 Flash 免费开放,性能反超 Pro?

​谷歌祭出“降维打击”:Gemini 3 Flash 免费开放,性能反超 Pro?

大模型领域的“性价比之战”再次升级!近日,谷歌宣布正式发布其最新一代轻量化旗舰模型 Gemini3Flash 。 令人惊喜的是,这款主打“极速与低成本”的新模型不仅全面取代了前代产品,成为谷歌搜索AI 模式及 Gemini 应用的默认底层引擎,更在多项实测中上演了“以下克上”的精彩戏码。 🚀速度快3倍,价格却大打折对于企业和开发者而言,Gemini3Flash的出现无异于一次“福利降临”。
12/18/2025 10:16:31 AM AI在线
MiniMax通过港交所上市聆讯,国产大模型“第一股”或将花落上海

MiniMax通过港交所上市聆讯,国产大模型“第一股”或将花落上海

据知情人士透露,上海人工智能独角兽企业稀宇科技(MiniMax)已正式通过港交所上市聆讯,有望成为首家登陆资本市场的国产大模型公司。 对此消息,MiniMax方面表示“不予置评”。 作为国内大模型赛道的头部玩家,MiniMax自成立以来备受瞩目,其背后股东包括阿里巴巴、腾讯等互联网巨头。
12/18/2025 10:16:31 AM AI在线
腾讯大模型架构重磅升级:成立 AI Infra 与 Data 部门,构建大模型训练推理全链路竞争力

腾讯大模型架构重磅升级:成立 AI Infra 与 Data 部门,构建大模型训练推理全链路竞争力

腾讯近日宣布对其大模型研发架构进行战略性调整,通过成立 AI Infra部、AI Data部及数据计算平台部,全面强化大模型的核心研发体系。 据 AIbase 报道,此次升级旨在构建从底层算力基础设施到高质量数据处理的全链路竞争力,为大模型的高效迭代与业务落地提供强力支撑。 在核心人事任命上,Vincesyao 正式出任“CEO/总裁办公室”首席 AI 科学家,直接向腾讯总裁刘炽平汇报;同时,他还兼任 AI Infra 部及大语言模型部负责人,向技术工程事业群总裁卢山汇报。
12/17/2025 7:06:22 PM AI在线
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

编辑部 整理自 MEET2026. 量子位 | 公众号 QbitAI在大模型参数竞赛卷到极致的今天,AI真正要跨过的门槛,已不再是“更强的能力”,而是“如何在行业里真正活起来”。 技术演进的焦点也随之从规模扩张转向一个更本质的问题:智能究竟如何在物理世界中持续产生价值。
12/16/2025 10:24:00 AM 思邈
Meta“Avocado”闭源模型定档2026春,Zuckerberg亲督战队

Meta“Avocado”闭源模型定档2026春,Zuckerberg亲督战队

Meta首席执行官马克·扎克伯格已接管公司AI商业化路线图,内部确认代号为「Avocado」的新一代大模型将于 2026 年春季以闭源形式发布,仅提供API及托管服务,不再开放权重。 Meta TBD Lab整合谷歌Gemma、OpenAI gpt-oss及阿里巴巴通义千问(Qwen)等第三方开源成果,用于Avocado的预训练与对齐,目标直指Frontier级别性能。 公司新近与英伟达签署价值 50 亿美元的H100 订单,专供Avocado训练集群。
12/11/2025 10:47:46 AM AI在线
仅有一位作者的论文,却补上了城市智能的「最后一公里」

仅有一位作者的论文,却补上了城市智能的「最后一公里」

在城市数字化不断加速的今天,交通管理、环境监测、公共安全等关键领域都面临着一个共同挑战:数据来源分散、质量参差不齐、传感器覆盖有限,导致许多真实世界问题无法依靠单一数据或单一模型得出稳定可靠的判断。 随着城市系统规模迅速扩大,如何整合多源信息,让人工智能真正理解并洞察现实世界,已经成为产业界与科研界共同关注的核心课题。 在这一背景下,长期深耕城市计算和多模态智能研究的郑宇教授,用一篇论文为行业带来了具有系统性突破性的跨域多模态知识融合框架。
12/9/2025 2:53:00 PM 郑佳美
国产算力“军团”集结:万卡推理引擎+开元模型同日发布

国产算力“军团”集结:万卡推理引擎+开元模型同日发布

2025光明科学城论坛・大湾区智能算力与大模型智能体论坛在深圳光明区举行,鹏城实验室、琶洲实验室、工商银行等机构集中发布四项重大成果:- 鹏城脑海2.1开源488B 多模态模型,同步放出2TB 清洗数据集与全流程工具链- 国产万卡推理引擎 FenixCOS 首次亮相,支持4096卡并行、千卡切换延迟 3秒,显存带宽利用率提升42%- 气象智能体“阿福”接入鹏城云脑Ⅲ,为第十五届全国运动会提供1km×1km 网格化预报- 工商银行发布国内首个全生命周期金融大模型工具集,覆盖需求、开发、测试、运维、退役五阶段,已在170个业务系统落地鹏城云脑Ⅲ进度更新:2026年总算力1000PFLOPS,接入“中国算力网”鹏城实验室主任高文通过视频透露,云脑Ⅲ已完成二期400PFLOPS 扩建,三期600PFLOPS 将于2026年 Q2上线,整体规模跻身全球 Top3科学计算装置;同时与无锡超算、国家气象信息中心等12家机构完成100G 专线互联,“中国算力网”骨干带宽突破3.2Tbps。 政产学研签约:光明区 AI 产业规模剑指1000亿论坛期间,鹏城实验室与深圳市气象局、琶洲实验室 (黄埔)、国家超算无锡中心签署四方合作协议,约定在数据、算力、模型、人才四维度全面互通。
12/5/2025 1:56:46 PM AI在线
网易有道词典2025年度词汇揭晓——“DeepSeek”全年867万次搜索量登顶

网易有道词典2025年度词汇揭晓——“DeepSeek”全年867万次搜索量登顶

网易有道词典今天发布2025年度热词,“DeepSeek”以全年867万次搜索量登顶,成为该平台历史上首位源自国产AI大模型的年度词汇。 搜索曲线显示,用户关注度在1月尚处低位,2月后随DeepSeek-R1推理模型发布迅速飙升,年内多次技术突破均带动新一轮查询高峰。 大学生和职场人群构成主要增量,查词后进一步浏览“大模型”“AI能力”等相关词条的比例显著提高,形成“查词—学概念—用模型”的完整学习链路。
12/2/2025 12:21:11 PM AI在线
AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险

AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险

鹭羽 发自 凹非寺. 量子位 | 公众号 QbitAI好好好,被DDL逼疯的又多一个,这次是AI。 正经研究发现,每天给Agent上压力push,AI也会撂挑子不干。
12/1/2025 3:35:21 PM 鹭羽
全球最顶尖的AI学术会议被 AI “攻陷” 超1.5万份审稿意见由 AI 代写

全球最顶尖的AI学术会议被 AI “攻陷” 超1.5万份审稿意见由 AI 代写

ICLR 2026 的审稿系统正被 AI “幽灵”大规模渗透:第三方检测显示,7.6 万份评审意见中 21% 完全由大模型一键生成,另有 35% 被 AI 不同程度润色,纯人类撰写的比例只剩 43%。 这些“机器评审”平均更长、打分更高,却频频出现“幻觉引用”或指责论文里根本不存在的数值错误,逼得作者集体在社交媒体吐槽。 面对信任崩塌,组委会发布“史上最严”封杀令:- 投稿端:若论文大量使用 LLM 却未声明,直接 desk reject;- 评审端:允许用 AI 辅助,但评审人对内容负全责,一旦出现虚假引用或“AI 废话”,其本人投稿亦可能被拒;- 举报通道:作者可私信标记疑似 AI 评审,程序主席将在未来两周内集中排查并公开处理结果。
11/30/2025 2:13:19 PM AI在线
苹果AI论文太坑了!用GPT写的GT,导致北京程序员通宵加班

苹果AI论文太坑了!用GPT写的GT,导致北京程序员通宵加班

衡宇 发自 凹非寺. 量子位 | 公众号 QbitAI大无语事件天天有,今天特别多——. AI大模型公司阶跃星辰的研究员,自曝被苹果挂在arXiv上的论文,狠狠坑了一把。
11/28/2025 5:07:43 PM 衡宇
实测完“灵光”,我意识到人类对 AI 助手的开发不足1%

实测完“灵光”,我意识到人类对 AI 助手的开发不足1%

今天的朋友圈,被一款叫「灵光」的APP刷屏了。 了解了一下,这是一款来自蚂蚁集团的AI 应用,定位是面向普通人的零门槛全模态 AI 助手,还可以自然语言30秒生成可互动的小应用。 这让我想到了还在预热,这周即将发布的Gemini3.0,一句话生成操作系统,这都给了我们一个无限想象力的画面。
11/27/2025 4:10:00 PM 齐铖湧
AI 时代转折:Ilya 断言“规模狂奔”终结,人类情感成下一个智能密码

AI 时代转折:Ilya 断言“规模狂奔”终结,人类情感成下一个智能密码

在人工智能发展史上,一个标志性时刻悄然到来。 知名AI专家Ilya Sutskever近日接受访谈,首次系统阐述了他离开OpenAI后创办SSI(安全超智能实验室)的全新愿景。 这场对话直击当下AI行业的痛点:模型测试分数亮眼,却难胜任真实任务。
11/27/2025 11:16:10 AM AI在线
国内最大AI“学术-产业-人才”盛会来了!20位院士+50位院长+300位专家集结北京海淀

国内最大AI“学术-产业-人才”盛会来了!20位院士+50位院长+300位专家集结北京海淀

允中 发自 凹非寺. 量子位 | 公众号 QbitAI当人工智能的奇点临近,当全球竞争的号角吹响,我们正站在一个决定未来的十字路口:. 在大模型时代,AI的下一场革命将在何处爆发?
11/26/2025 3:45:14 PM 思邈
​百度新设立两个大模型研发部门,全力推进大模型技术

​百度新设立两个大模型研发部门,全力推进大模型技术

百度近日发布公告,宣布设立两个新的大模型研发部门,旨在加强其在人工智能领域的技术实力。 基础模型研发部将专注于开发高智能、可扩展的通用人工智能大模型,由吴甜负责;而应用模型研发部则将着眼于业务应用场景所需的专精模型调优与探索,由贾磊领导。 这两个部门均直接向百度的首席执行官李彦宏汇报,表明了公司对大模型研发的高度重视。
11/26/2025 12:32:04 PM AI在线