大模型

卡帕西大模型横评方法太好玩！四大AI匿名参赛评分，最强出乎意料

卡帕西大模型横评方法太好玩！四大AI匿名参赛评分，最强出乎意料

鹭羽发自凹非寺. 量子位 | 公众号 QbitAI卡帕西又来发布趣味编程项目了～. 这次直接整了一个“大模型议会”（LLM Council）web app。

11/23/2025 1:52:14 PM 鹭羽

啊？微博7800美元训的大模型，数学能力超了DeepSeek-R1

啊？微博7800美元训的大模型，数学能力超了DeepSeek-R1

允中发自凹非寺. 量子位 | 公众号 QbitAI当整个AI行业陷入“参数竞赛”的狂热时，微博AI交出了一份出乎意料的答卷，为沸腾的大模型战场开辟了一条充满想象力的新路径。近日，微博正式发布首个自研开源大模型VibeThinker，这个仅拥有15亿参数的“轻量级选手”，在国际顶级数学竞赛基准测试上击败了参数量是其数百倍的、高达6710亿的DeepSeek R1模型。

11/18/2025 2:11:05 PM 思邈

中国 AI 正处于反超美国的前夜

中国 AI 正处于反超美国的前夜

2025 年下半年，中美 AI 圈中的讨论，有两个有趣的现象：一是，讨论的焦点不再是“中美技术究竟差几代”，而是开始认可中国 AI 势力崛起甚至即将迎来反超，比如以 Airbnb 为代表的海外企业，公开表示大量采用通义千问而不常用 OpenAI；MiniMax开源模型 M2 的 AI Coding 能力超越 Claude，位居 OpenRouter 编程能力前三。二是，资本的豪赌与泡沫风险都更加剧烈——OpenAI 与英伟达等厂商签下了 1.4 万亿美元算力订单；OpenAI CFO 一句“需要政府为 AI 投资担保”的言论引发了美股科技股大地震，八大科技巨头一周内蒸发近 8000 亿美元。不同的是，前者指向市场，说明需求方不再盲目追求智能上限，转而选择成本低、速度快、更具性价比的中国模型；后者则指向资本，揭示了美国 AI 产业在极高的估值和巨大的资本支出（CAPEX）之间正面临着一场严峻质疑，投资者对需要持续给创业公司输血的“高举高打”模式，已经开始感到不安和恐慌。

11/18/2025 10:01:00 AM 徐咪

独家 | 刘炯接管 GN06 团队，向美团平台负责人李树斌汇报

独家 | 刘炯接管 GN06 团队，向美团平台负责人李树斌汇报

据我们了解，今年以来，美团 GN06 团队几乎不再招聘，这或许意味着，其团队已经完成初步搭建。美团招聘官网显示，其仍有 GN06 团队的职位招聘，不过更新停留在今年6月。 GN06 团队对 AI 应用产品经理的职位描述，仍然提到探索美团现在主营业务外的新 AI 应用产品，方向边界不限。

11/17/2025 11:50:00 AM 聪聪

阿里云大模型价格腰斩！通义千问3-Max调用费直降50%，缓存命中仅收10%费用

阿里云大模型价格腰斩！通义千问3-Max调用费直降50%，缓存命中仅收10%费用

大模型“价格战”再掀高潮。阿里云旗下大模型服务平台百炼今日宣布，自2025年11月13日起，面向中国站（北京区域）的通义千问3-Max模型全面降价，核心调用费用直接腰斩，并同步优化缓存计费策略，大幅降低企业与开发者的长期使用成本。此举旨在打破大模型应用的“高门槛”困局，加速AI在中小企业数字化转型中的落地。

11/14/2025 9:36:53 AM AI在线

字节跳动大模型研究员因泄密被开除！曾频繁在知乎曝光机器人研发细节，公司重拳整治信息安全

字节跳动大模型研究员因泄密被开除！曾频繁在知乎曝光机器人研发细节，公司重拳整治信息安全

近日，公司大模型团队（Seed）研究员任某某已确认离职，据多位内部人士透露，其系因多次泄露公司保密信息被正式辞退。值得注意的是，任某某在知乎平台拥有超8万粉丝，曾频繁发布涉及字节跳动机器人研发进展、技术路线与内部项目细节的内容，引发高度关注，也最终招致公司纪律审查。从工程师到“泄密者”:高调分享酿成职业危机公开资料显示，任某某在加入字节前曾任职于珞石科技与小米集团，长期深耕机器人系统集成领域。

11/13/2025 4:57:41 PM AI在线

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线

11月10日，腾讯云官网发布重要公告，宣布将对旗下部分旧版本大模型进行下线及切换升级调整，以配合其大模型技术的持续升级与迭代发布。根据公告的下线规划，腾讯云 DeepSeek-V3模型和 DeepSeek-R1模型将于北京时间 2025年11月24日00:00 起正式下线。届时，腾讯云将不再为这两个旧版本模型提供任何接入服务。

11/10/2025 4:26:09 PM AI在线

AI 的本质不是算力，而是「上下文革命」

AI 的本质不是算力，而是「上下文革命」

过去几年，人工智能的浪潮一次又一次刷新人们的想象：模型变得更大、算力更强、应用更广。但在光鲜的成果背后，一个更深层的问题被不断暴露 —— AI 真的“理解”世界了吗？它能记住对话，却常常忘记语境，能生成答案，却未必明白问题的由来。

11/7/2025 11:15:00 AM 郑佳美

中国华电发布 “华电智” 大模型，能源管理进入智能新时代

中国华电发布 “华电智” 大模型，能源管理进入智能新时代

在11月4日举行的2025年中国华电新型电力系统技术创新论坛上，中国华电正式发布了其最新研发的“华电智”大模型。这一模型在人工智能与预测应用方面表现突出，标志着中国在电力行业智能化转型的又一重要里程碑。 “华电智”大模型全球首创了径流预测大模型，显著提升了水能利用的预测精度。

11/5/2025 9:42:34 AM AI在线

大模型正颠覆金融服务，度小满CEO揭秘AI如何助力普惠金融

大模型正颠覆金融服务，度小满CEO揭秘AI如何助力普惠金融

在定于11月3日开幕的2025年香港金融科技周上，金融科技与人工智能的深度融合再次成为全球焦点。本届盛会汇集了香港特区行政长官李家超、诺贝尔物理学奖得主杰弗里·辛顿（Geoffrey Hinton）等重量级嘉宾。其中，度小满 CEO 朱光发表了重要演讲，详细阐述了大模型(Large Language Model， LLM)在金融服务行业的创新应用与颠覆性影响。

11/4/2025 5:41:52 PM AI在线

字节跳动新举措！推出豆包股激励计划，吸引大模型人才

字节跳动新举措！推出豆包股激励计划，吸引大模型人才

字节跳动最近在大模型领域推出了一项颇具创新的「豆包长期激励计划」。这一计划的核心在于建立一个「虚拟股」机制，旨在通过授予员工豆包股和类似字节期权的回购机制，进一步吸引和留住那些在人工智能（AI）和大模型技术方面的人才。随着 AI 技术的快速发展，人才的竞争愈发激烈。

11/4/2025 10:51:51 AM AI在线

稠密监督 × 策略内采样：On-Policy Distillation 如何以 1/10 成本训练专家级小模型

稠密监督 × 策略内采样：On-Policy Distillation 如何以 1/10 成本训练专家级小模型

大家好，我是肆〇柒。我看到一项来自 Thinking Machines Lab 的前沿研究——《On-Policy Distillation》。这项工作巧妙融合了强化学习的策略内采样优势与知识蒸馏的稠密监督信号，不仅将后训练成本降至传统 RL 的十分之一，还在数学推理、个性化助手和持续学习等关键场景中展现出惊人的效率与稳定性。

11/4/2025 9:42:07 AM 肆零柒

LangChain 大模型应用开发框架：从 RAG 到 Agent 的完整指南

LangChain 大模型应用开发框架：从 RAG 到 Agent 的完整指南

在AI大模型时代，Python以23.08%的市场份额连续五年稳居编程语言榜首，在AI、数据科学、深度学习等前沿技术中的应用尤为广泛。而LangChain作为一个基于大语言模型(LLM)的应用程序开发框架，提供了一整套工具、组件和接口，简化了创建大模型应用程序的过程，已经成为大模型应用开发的事实标准。本文将从零到一地介绍如何使用LangChain构建从检索增强生成(RAG)到智能代理(Agent)的完整应用。

11/4/2025 7:15:00 AM 用户007

最新外国「自研」大模型，都是套壳国产？

最新外国「自研」大模型，都是套壳国产？

外国开发者：我们该开始学习中文了吗？绷不住了，美国科技公司最新发布的大模型，思考时怎么一直在说中文？本周，知名 AI 代码工具 Cursor 发布了 2.0 版重大更新，推出了首个自家的代码模型 Composer，以及用于并行协作多个智能体的新界面。

11/1/2025 8:51:00 PM 机器之心

最具争议性研究：大模型中间层输出可 100% 反推原始输入

最具争议性研究：大模型中间层输出可 100% 反推原始输入

最近，一篇名为《Language Models are Injective and Hence Invertible》的论文在学术界和科技圈引起了广泛讨论，甚至连老马的 Grok 官方也下场转发。这篇论文出自意大利罗马第一大学（Sapienza University of Rome）的 GLADIA Research Lab，文中提出了一个颇有争议却又耐人寻味的观点：主流的 Transformer 语言模型在信息处理过程中几乎不会丢失任何输入内容，从数学意义上看，它们是可逆的。换句话说，模型的隐藏状态并不是模糊的语义压缩，而是一种能够完整保留输入信息的精确重编码。

10/31/2025 3:27:00 PM 郑佳美

英伟达再掷十亿美元，加码 AI 编程新锐 Poolside

英伟达再掷十亿美元，加码 AI 编程新锐 Poolside

据彭博社援引知情人士消息，芯片巨头英伟达（Nvidia）计划向 AI 编程模型公司 Poolside 追加投资 5 亿至 10 亿美元，助力后者完成总额 20 亿美元的新一轮融资。该轮融资对 Poolside 的投前估值为 120 亿美元，若交割顺利，英伟达最终出资金额将视其他投资者到位情况最高升至 10 亿美元。 Poolside 总部位于美国与巴黎，专注为软件开发场景构建大模型，其工具主要面向代码生成、调试及自动化编程流程，客户已覆盖国防与政府部门。

10/31/2025 9:46:42 AM AI在线

大模型去全球接单平台赚外快，98%惨遭老板退货！ScaleAI宣布新智能体基准：AI绝对自动化几乎为0，大多知名基准过时、封闭

大模型去全球接单平台赚外快，98%惨遭老板退货！ScaleAI宣布新智能体基准：AI绝对自动化几乎为0，大多知名基准过时、封闭

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）如果让大模型去外包平台去接单，它真的可以赚到钱吗？现在终于有专业的评测机构站出来公布答案了。不用硬夸AI，事实是让它接单，它会饿死。

10/30/2025 1:30:49 PM 云昭

如何理解：高效的异构算力调度是业界目前面临的一大难题？

如何理解：高效的异构算力调度是业界目前面临的一大难题？

Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景 - 构建大模型应用架构设施底座：异构算力。在后摩尔时代与AI爆发的双重驱动下，计算架构正经历一场从同构到异构的深刻变革。以 GPU、NPU、FPGA、DPU .

10/30/2025 9:45:53 AM Luga Lee

资讯热榜

AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool 最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 GGUF 是什么？一文看懂大模型里最火的模型格式后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉