大模型
Meta“Avocado”闭源模型定档2026春,Zuckerberg亲督战队
Meta首席执行官马克·扎克伯格已接管公司AI商业化路线图,内部确认代号为「Avocado」的新一代大模型将于 2026 年春季以闭源形式发布,仅提供API及托管服务,不再开放权重。 Meta TBD Lab整合谷歌Gemma、OpenAI gpt-oss及阿里巴巴通义千问(Qwen)等第三方开源成果,用于Avocado的预训练与对齐,目标直指Frontier级别性能。 公司新近与英伟达签署价值 50 亿美元的H100 订单,专供Avocado训练集群。
12/11/2025 10:47:46 AM
AI在线
仅有一位作者的论文,却补上了城市智能的「最后一公里」
在城市数字化不断加速的今天,交通管理、环境监测、公共安全等关键领域都面临着一个共同挑战:数据来源分散、质量参差不齐、传感器覆盖有限,导致许多真实世界问题无法依靠单一数据或单一模型得出稳定可靠的判断。 随着城市系统规模迅速扩大,如何整合多源信息,让人工智能真正理解并洞察现实世界,已经成为产业界与科研界共同关注的核心课题。 在这一背景下,长期深耕城市计算和多模态智能研究的郑宇教授,用一篇论文为行业带来了具有系统性突破性的跨域多模态知识融合框架。
12/9/2025 2:53:00 PM
郑佳美
国产算力“军团”集结:万卡推理引擎+开元模型同日发布
2025光明科学城论坛・大湾区智能算力与大模型智能体论坛在深圳光明区举行,鹏城实验室、琶洲实验室、工商银行等机构集中发布四项重大成果:- 鹏城脑海2.1开源488B 多模态模型,同步放出2TB 清洗数据集与全流程工具链- 国产万卡推理引擎 FenixCOS 首次亮相,支持4096卡并行、千卡切换延迟 3秒,显存带宽利用率提升42%- 气象智能体“阿福”接入鹏城云脑Ⅲ,为第十五届全国运动会提供1km×1km 网格化预报- 工商银行发布国内首个全生命周期金融大模型工具集,覆盖需求、开发、测试、运维、退役五阶段,已在170个业务系统落地鹏城云脑Ⅲ进度更新:2026年总算力1000PFLOPS,接入“中国算力网”鹏城实验室主任高文通过视频透露,云脑Ⅲ已完成二期400PFLOPS 扩建,三期600PFLOPS 将于2026年 Q2上线,整体规模跻身全球 Top3科学计算装置;同时与无锡超算、国家气象信息中心等12家机构完成100G 专线互联,“中国算力网”骨干带宽突破3.2Tbps。 政产学研签约:光明区 AI 产业规模剑指1000亿论坛期间,鹏城实验室与深圳市气象局、琶洲实验室 (黄埔)、国家超算无锡中心签署四方合作协议,约定在数据、算力、模型、人才四维度全面互通。
12/5/2025 1:56:46 PM
AI在线
网易有道词典2025年度词汇揭晓——“DeepSeek”全年867万次搜索量登顶
网易有道词典今天发布2025年度热词,“DeepSeek”以全年867万次搜索量登顶,成为该平台历史上首位源自国产AI大模型的年度词汇。 搜索曲线显示,用户关注度在1月尚处低位,2月后随DeepSeek-R1推理模型发布迅速飙升,年内多次技术突破均带动新一轮查询高峰。 大学生和职场人群构成主要增量,查词后进一步浏览“大模型”“AI能力”等相关词条的比例显著提高,形成“查词—学概念—用模型”的完整学习链路。
12/2/2025 12:21:11 PM
AI在线
AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险
鹭羽 发自 凹非寺. 量子位 | 公众号 QbitAI好好好,被DDL逼疯的又多一个,这次是AI。 正经研究发现,每天给Agent上压力push,AI也会撂挑子不干。
12/1/2025 3:35:21 PM
鹭羽
全球最顶尖的AI学术会议被 AI “攻陷” 超1.5万份审稿意见由 AI 代写
ICLR 2026 的审稿系统正被 AI “幽灵”大规模渗透:第三方检测显示,7.6 万份评审意见中 21% 完全由大模型一键生成,另有 35% 被 AI 不同程度润色,纯人类撰写的比例只剩 43%。 这些“机器评审”平均更长、打分更高,却频频出现“幻觉引用”或指责论文里根本不存在的数值错误,逼得作者集体在社交媒体吐槽。 面对信任崩塌,组委会发布“史上最严”封杀令:- 投稿端:若论文大量使用 LLM 却未声明,直接 desk reject;- 评审端:允许用 AI 辅助,但评审人对内容负全责,一旦出现虚假引用或“AI 废话”,其本人投稿亦可能被拒;- 举报通道:作者可私信标记疑似 AI 评审,程序主席将在未来两周内集中排查并公开处理结果。
11/30/2025 2:13:19 PM
AI在线
苹果AI论文太坑了!用GPT写的GT,导致北京程序员通宵加班
衡宇 发自 凹非寺. 量子位 | 公众号 QbitAI大无语事件天天有,今天特别多——. AI大模型公司阶跃星辰的研究员,自曝被苹果挂在arXiv上的论文,狠狠坑了一把。
11/28/2025 5:07:43 PM
衡宇
实测完“灵光”,我意识到人类对 AI 助手的开发不足1%
今天的朋友圈,被一款叫「灵光」的APP刷屏了。 了解了一下,这是一款来自蚂蚁集团的AI 应用,定位是面向普通人的零门槛全模态 AI 助手,还可以自然语言30秒生成可互动的小应用。 这让我想到了还在预热,这周即将发布的Gemini3.0,一句话生成操作系统,这都给了我们一个无限想象力的画面。
11/27/2025 4:10:00 PM
齐铖湧
AI 时代转折:Ilya 断言“规模狂奔”终结,人类情感成下一个智能密码
在人工智能发展史上,一个标志性时刻悄然到来。 知名AI专家Ilya Sutskever近日接受访谈,首次系统阐述了他离开OpenAI后创办SSI(安全超智能实验室)的全新愿景。 这场对话直击当下AI行业的痛点:模型测试分数亮眼,却难胜任真实任务。
11/27/2025 11:16:10 AM
AI在线
国内最大AI“学术-产业-人才”盛会来了!20位院士+50位院长+300位专家集结北京海淀
允中 发自 凹非寺. 量子位 | 公众号 QbitAI当人工智能的奇点临近,当全球竞争的号角吹响,我们正站在一个决定未来的十字路口:. 在大模型时代,AI的下一场革命将在何处爆发?
11/26/2025 3:45:14 PM
思邈
百度新设立两个大模型研发部门,全力推进大模型技术
百度近日发布公告,宣布设立两个新的大模型研发部门,旨在加强其在人工智能领域的技术实力。 基础模型研发部将专注于开发高智能、可扩展的通用人工智能大模型,由吴甜负责;而应用模型研发部则将着眼于业务应用场景所需的专精模型调优与探索,由贾磊领导。 这两个部门均直接向百度的首席执行官李彦宏汇报,表明了公司对大模型研发的高度重视。
11/26/2025 12:32:04 PM
AI在线
卡帕西大模型横评方法太好玩!四大AI匿名参赛评分,最强出乎意料
鹭羽 发自 凹非寺. 量子位 | 公众号 QbitAI卡帕西又来发布趣味编程项目了~. 这次直接整了一个“大模型议会”(LLM Council)web app。
11/23/2025 1:52:14 PM
鹭羽
啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1
允中 发自 凹非寺. 量子位 | 公众号 QbitAI当整个AI行业陷入“参数竞赛”的狂热时,微博AI交出了一份出乎意料的答卷,为沸腾的大模型战场开辟了一条充满想象力的新路径。 近日,微博正式发布首个自研开源大模型VibeThinker,这个仅拥有15亿参数的“轻量级选手”,在国际顶级数学竞赛基准测试上击败了参数量是其数百倍的、高达6710亿的DeepSeek R1模型。
11/18/2025 2:11:05 PM
思邈
中国 AI 正处于反超美国的前夜
2025 年下半年,中美 AI 圈中的讨论,有两个有趣的现象:一是,讨论的焦点不再是“中美技术究竟差几代”,而是开始认可中国 AI 势力崛起甚至即将迎来反超,比如以 Airbnb 为代表的海外企业,公开表示大量采用通义千问而不常用 OpenAI;MiniMax开源模型 M2 的 AI Coding 能力超越 Claude,位居 OpenRouter 编程能力前三。 二是,资本的豪赌与泡沫风险都更加剧烈——OpenAI 与英伟达等厂商签下了 1.4 万亿美元算力订单;OpenAI CFO 一句“需要政府为 AI 投资担保”的言论引发了美股科技股大地震,八大科技巨头一周内蒸发近 8000 亿美元。 不同的是,前者指向市场,说明需求方不再盲目追求智能上限,转而选择成本低、速度快、更具性价比的中国模型;后者则指向资本,揭示了美国 AI 产业在极高的估值和巨大的资本支出(CAPEX)之间正面临着一场严峻质疑,投资者对需要持续给创业公司输血的“高举高打”模式,已经开始感到不安和恐慌。
11/18/2025 10:01:00 AM
徐咪
独家 | 刘炯接管 GN06 团队,向美团平台负责人李树斌汇报
据我们了解,今年以来,美团 GN06 团队几乎不再招聘,这或许意味着,其团队已经完成初步搭建。 美团招聘官网显示,其仍有 GN06 团队的职位招聘,不过更新停留在今年6月。 GN06 团队对 AI 应用产品经理的职位描述,仍然提到探索美团现在主营业务外的新 AI 应用产品,方向边界不限。
11/17/2025 11:50:00 AM
聪聪
阿里云大模型价格腰斩!通义千问3-Max调用费直降50%,缓存命中仅收10%费用
大模型“价格战”再掀高潮。 阿里云旗下大模型服务平台百炼今日宣布,自2025年11月13日起,面向中国站(北京区域)的通义千问3-Max模型全面降价,核心调用费用直接腰斩,并同步优化缓存计费策略,大幅降低企业与开发者的长期使用成本。 此举旨在打破大模型应用的“高门槛”困局,加速AI在中小企业数字化转型中的落地。
11/14/2025 9:36:53 AM
AI在线
字节跳动大模型研究员因泄密被开除!曾频繁在知乎曝光机器人研发细节,公司重拳整治信息安全
近日,公司大模型团队(Seed)研究员任某某已确认离职,据多位内部人士透露,其系因多次泄露公司保密信息被正式辞退。 值得注意的是,任某某在知乎平台拥有超8万粉丝,曾频繁发布涉及字节跳动机器人研发进展、技术路线与内部项目细节的内容,引发高度关注,也最终招致公司纪律审查。 从工程师到“泄密者”:高调分享酿成职业危机公开资料显示,任某某在加入字节前曾任职于珞石科技与小米集团,长期深耕机器人系统集成领域。
11/13/2025 4:57:41 PM
AI在线
腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线
11月10日,腾讯云官网发布重要公告,宣布将对旗下部分旧版本大模型进行下线及切换升级调整,以配合其大模型技术的持续升级与迭代发布。 根据公告的下线规划,腾讯云 DeepSeek-V3模型和 DeepSeek-R1模型将于北京时间 2025年11月24日00:00 起正式下线。 届时,腾讯云将不再为这两个旧版本模型提供任何接入服务。
11/10/2025 4:26:09 PM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
开发者
具身智能
xAI
生成式
神经网络
机器学习
3D
人形机器人
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测