理论

均值至上假繁荣！北大新作专挑难题，逼出AI模型真本事

均值至上假繁荣！北大新作专挑难题，逼出AI模型真本事

当强化学习（RL）成为大模型后训练的核心工具，「带可验证奖励的强化学习（RLVR）」凭借客观的二元反馈（如解题对错），迅速成为提升推理能力的主流范式。从数学解题到代码生成，RLVR本应推动模型突破「已知答案采样」的局限，真正掌握深度推理逻辑——但现实是，以GRPO为代表的主流方法正陷入「均值优化陷阱」。这些基于均值的优化策略，过度聚焦高概率输出序列，却忽略了「低概率但高信息密度」的推理路径：模型训练早期就会出现熵坍缩，过早丧失探索能力；面对全错的难题时，优势函数直接归零，模型在薄弱环节完全无法学习。

10/24/2025 1:04:00 PM

红色警报：OpenAI的Atlas浏览器，是捅向谷歌万亿心脏的匕首吗？

红色警报：OpenAI的Atlas浏览器，是捅向谷歌万亿心脏的匕首吗？

浏览器「第三次世界大战」打响！ OpenAI向谷歌扔下一个AI核弹，谁能掌握未来互联网之门的钥匙？一觉醒来，变天了！

10/24/2025 12:50:34 PM 新智元

李开复：美国在AI硬件赛道已败给中国！中国AI算力将是美国十倍！警告AI速度失控：先上车再修路，将酿成重大事故！

李开复：美国在AI硬件赛道已败给中国！中国AI算力将是美国十倍！警告AI速度失控：先上车再修路，将酿成重大事故！

编辑 | 云昭在旧金山TED AI大会上，创新工场董事长、AI科学家李开复通过视频连线发表演讲，罕见地直言：“在AI硬件和机器人制造方面，美国正在被中国超越。 ”李表示，这一点也不夸张。在AI硬件与机器人赛道，中国的领先正在成为事实。

10/24/2025 12:45:11 PM 云昭

一图胜千言被实现了！DeepSeek-OCR用图片压缩文本，10倍压缩率

一图胜千言被实现了！DeepSeek-OCR用图片压缩文本，10倍压缩率

DeepSeek开源了DeepSeek-OCR，用1张图片的信息，还原10页书的文字，10倍的压缩率，可以做到几乎不丢失信息。视觉编码器走了不少弯路大型语言模型记性不好，或者说，能记住的东西太有限。你给它一篇长长的文章，它的计算量呈二次方往上飙。

10/24/2025 12:19:18 PM

斯坦福与Adobe新研究，模仿蒸馏技术轻松让200亿参数图像生成高质量大模型

斯坦福与Adobe新研究，模仿蒸馏技术轻松让200亿参数图像生成高质量大模型

高质量图像生成又加速了！斯坦福大学和 Adobe 研究院联手，用 pi-Flow（基于策略的流模型）技术，让 200 亿参数的文本到图像大模型，在 4 步之内就生成了媲美教师模型的高质量、高多样性图片。让图像生成模型少走几步所有玩过 AI 绘画的人都有一个共同的体验，未蒸馏的原版大模型，点击生成，看着进度条一点点爬升，从一个模糊的噪声，慢慢变得清晰。

10/24/2025 12:17:22 PM

夸克AI眼镜开售，88VIP叠加9折消费券，超低价格仅需3329元

夸克AI眼镜开售，88VIP叠加9折消费券，超低价格仅需3329元

10月24日零点，阿里巴巴首款自研的夸克AI眼镜在其天猫官方店铺——夸克智能设备旗舰店上正式首发。天猫平台的实时成交竞速榜单显示，新品上线销售后仅7个小时，便成为双11期间智能眼镜行业top2品牌。不少消费者已经在社交媒体及粉丝群里陆续晒出购买订单。

10/24/2025 11:18:54 AM

MinerU2.5源码拆解：双后端架构设计与企业级部署实践

MinerU2.5源码拆解：双后端架构设计与企业级部署实践

8月中旬的时候，我去MinerU的办公室交流过一次。当时对方有位工作人员表示，接下来会很快基于视觉模型的路线实现全面 SOTA。说实话，那个时候我还挺怀疑的。

10/24/2025 11:16:41 AM 韦东东

基于JoyAgent的二开工程实践（信贷尽调报告生成）

基于JoyAgent的二开工程实践（信贷尽调报告生成）

很久没更新，书稿终于写完了，后续恢复每周一到两更。这篇来继续聊聊 Agent, 这个现在有些烂大街的概念。我在历史文章中提到 Agent 的案例演示时，大多是围绕 Dify，介绍了些诸如设备预测性运维、多源异构数据分析等使用场景。

10/24/2025 11:12:14 AM 韦东东

人工智能的“苦涩教训”：辛顿最清醒的警告

人工智能的“苦涩教训”：辛顿最清醒的警告

在人工智能的历史上，杰弗里·辛顿（Geoffrey Hinton）不仅是深度学习的奠基人，更像是一个时代的镜子。他提出的“苦涩的教训（The Bitter Lesson）”，直到今天，依然是AI研究者绕不开的一记耳光——它提醒我们，聪明的人类往往高估了自己设计“聪明系统”的能力，而低估了计算和数据的力量。这条教训，之所以“苦涩”，是因为它击中了人类的骄傲。

10/24/2025 11:00:58 AM AI大模型应用开发

多轮交互驱动的Text-to-SQL智能体

多轮交互驱动的Text-to-SQL智能体

在大语言模型（LLM）风头正劲的当下，让普通用户用自然语言向数据库提问、自动生成 SQL 查询成为一种重要探索方向，即所谓 Text-to-SQL 技术。尽管近年来已有不少成果，但在真实场景下，Text-to-SQL 仍存在一些挑战，尤其是在多轮交互、宽表（很多列）查询、可解释性等方面：用户常常不是一次性把完整问题说出来，而是一步步迭代补充、提出子问题数据库表可能列很多、关系复杂，模型在“选列”“join”“过滤条件”上容易出错模型直接给一个 SQL 字符串，往往不透明、难以调试与纠错这篇论文 “Interactive-T2S” 正是在这类痛点中切入，提出一种交互式、多轮驱动的 Text-to-SQL 框架，让模型在生成 SQL 的过程中向数据库“发问”、拉取信息，从而提高准确性与可解释性。下面，我们从核心思路、方法设计、实验结果及未来展望四个层面解读。

10/24/2025 10:58:24 AM

Apache Doris 4.0 把 AI 塞进数据库了！？

Apache Doris 4.0 把 AI 塞进数据库了！？

“哥，Doris 4.0 把 AI 塞进数据库了！ ”凌晨一点，DBA老周在群里甩出这句话，附带一张截图：一条 SQL 直接调通简历筛选，把 30 万份数据 3 秒跑完。我盯着屏幕，咖啡差点洒键盘——这年头，连数据库都开始抢 HR 的饭碗？

10/24/2025 10:51:05 AM 大数据AI智能圈

从零实现一个17M参数的GPT预训练模型

从零实现一个17M参数的GPT预训练模型

大家好，我是写代码的中年人！今天我们使用开源的的中文数据进行模型的预训练，下面跟着我的步骤，从零实现你的预训练模型。本文所有代码和数据资源位置：、预训练模型的概念预训练模型(Pretrained Model)就是一个已经在海量数据上训练过的模型，它学会了语言的基本规律、结构和语义，然后可以拿来做各种下游任务，比如写作、翻译、问答、分类、生成代码等。

10/24/2025 10:41:33 AM 写代码的中年人

揭秘大模型的魔法：从零实现一个简化版的GPT 模型

揭秘大模型的魔法：从零实现一个简化版的GPT 模型

大家好，我是写代码的中年人！今天我们结合代码从零实现一个简化版 GPT 模型。近年来，大语言模型席卷了人工智能领域，从 ChatGPT 到 LLaMA，它们以惊人的语言理解和生成能力改变了我们与机器交互的方式。

10/24/2025 10:34:55 AM 写代码的中年人

倒计时18个月！微软AI CEO爆料：类人意识AI或将降临

倒计时18个月！微软AI CEO爆料：类人意识AI或将降临

AI可能产生意识吗？如果可能，大概会在什么时间？微软AI CEO Mustafa Suleyman认为有可能诞生「看似有意识的AI」，而且最快可能在18个月内出现：未来5年很有可能，18个月内也有一定可能性。

10/24/2025 10:13:37 AM

Meta打碎Transformer 8年铁律！改写AI最底层规则，模型首次冒出潜意识

Meta打碎Transformer 8年铁律！改写AI最底层规则，模型首次冒出潜意识

Transformer可以说整个LLM的基石，但这个基石要松动了！ 8年了！持续了8年的Transformer底层架构似乎要被Meta打破了。

10/24/2025 10:10:22 AM

"在思考中回忆，在回忆中思考"：MemGen 开启 AI 记忆新范式

"在思考中回忆，在回忆中思考"：MemGen 开启 AI 记忆新范式

大家好，我是肆〇柒。今天要和大家分享的是一项来自新加坡国立大学的突破性研究——MemGen。这项研究由张贵斌、付沐鑫和严水城三位研究者主导，他们发现现有LLM智能体的记忆机制存在根本局限：参数化方法导致灾难性遗忘，检索式方法则难以实现记忆与推理的无缝融合。

10/24/2025 9:41:21 AM 肆零柒

田渊栋被裁后新offer排到法国！原来Llama 4.5训完后被卸磨杀驴了

田渊栋被裁后新offer排到法国！原来Llama 4.5训完后被卸磨杀驴了

硅谷真是干啥都迅猛啊！裁员也是……量子位刚刚从Meta一线获悉，田渊栋前脚刚发了推文说自己被裁，后脚就被解除了公司内部各种权限——嘿，亚历山大王的刀，就是这么快。这也是这次裁员中最具争议的地方，“在Meta工作已超过十年的田渊栋和他的组员，整组被一锅端了”，这是为什么？

10/24/2025 9:31:42 AM

OpenAI收购macOS供应商，剑指GPT操作系统！微软也不装了

OpenAI收购macOS供应商，剑指GPT操作系统！微软也不装了

OpenAI也是个十足的果粉……推出Mac专属浏览器还不够，他们这次可能干脆要做一套苹果专属UX。我们已收购SAI（Software Applications Incorporated），这家公司开发了Sky——一款面向Mac的自然语言交互界面。消息一出，网友们直呼畅快：终于有人来帮苹果收拾AI的烂摊子了。

10/24/2025 9:14:42 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉