DeepSeek“企鹅家族”深夜泄露：512 预算 Emperor 剑指 GPT-5.2，无推理 Mumble 挑战极速响应

作者：AI在线 2025-12-04 06:12

12月4日凌晨，GitHub 与 DesignArena 同步流出 OpenAI 内部代号“企鹅”（Penguin）的全新模型矩阵，四档推理预算首次曝光:旗舰 Emperor512、中端 Rockhopper64、轻量 Macaroni16与零推理 Mumble0，覆盖从云端到边缘的全场景需求。图源备注：图片由AI生成，图片授权服务商Midjourney512推理预算!Emperor 或成 GPT-5.2核心内部文件显示，Emperor 拥有512单位“juice”推理预算，为现行模型8-10倍，端到端延迟却控制在80ms 以内，实现“零等待”对话体验;代码路径已嵌入实时剪枝与动态计算分配，疑似为明年 GPT-5.2提供底层架构。

12月4日凌晨，GitHub 与 DesignArena 同步流出 OpenAI 内部代号“企鹅”（Penguin）的全新模型矩阵，四档推理预算首次曝光:旗舰 Emperor512、中端 Rockhopper64、轻量 Macaroni16与零推理 Mumble0，覆盖从云端到边缘的全场景需求。

大模型元宇宙 (1)

图源备注：图片由AI生成，图片授权服务商Midjourney

512推理预算!Emperor 或成 GPT-5.2核心

内部文件显示，Emperor 拥有512单位“juice”推理预算，为现行模型8-10倍，端到端延迟却控制在80ms 以内，实现“零等待”对话体验;代码路径已嵌入实时剪枝与动态计算分配，疑似为明年 GPT-5.2提供底层架构。

四档预算=四种 latency:Macaroni 主打极速，Mumble 彻底去推理

- Rockhopper（64）(中端)定位“推理+速度”平衡，目标替代 GPT-4.5

- Macaroni（16）面向移动端，首次在8Gen3芯片跑通70B 模型

- Mumble（0）完全跳过推理步骤，响应时间<50ms，用于高频自动完成与语音打断场景

记忆搜索同步曝光:一键召回对话上下文

同批泄露的代码显示，ChatGPT 将新增“Memory Search”按钮，用户输入自然语言即可即时检索历史记忆，无需再手动翻找聊天记录;该功能已内测，预计与企鹅家族模型一同上线。

Shallotpeat & Garlic 接踵而至:OpenAI 拉响红色警报

The Information 补充，OpenAI 下周或发布内部代号 Shallotpeat 的新推理模型，性能已领先 Gemini3;另一款 Garlic 完成预训练，2026年初以 GPT-5.2/5.5形式推出，主打“小参数+高密度知识”路线，直接对标谷歌“预训练飞跃”。

行业震荡:开源与闭源同时提速

- 对于开发者，四档预算意味着同一代号即可调用“延迟-成本-精度”不同组合，API 定价有望下探30%

- 对于竞品，OpenAI 首次把“推理 budget”做成明码标价，迫使 Google、Anthropic 跟进类似分级

- 对于监管，零推理 Mumble 的极速响应可能放大错误率，安全评估或成为发布前最后一道关卡

OpenAI 尚未公布企鹅家族具体发布日期，但已在 DesignArena 开启盲测，获胜模型将直接并入 ChatGPT Plus 与 Enterprise 通道。AIbase 将持续跟踪，第一时间带来基准成绩与 API 定价细节。

GitHub Copilot 推出视觉功能：图片可秒变代码

GitHub 宣布了其 AI 编程助手 Copilot 的一系列重大更新，此次更新中最引人注目的功能之一是 Copilot 的“Vision”功能。该功能允许用户在聊天中上传截图、照片或图表，Copilot 将基于这些图像生成相应的界面、代码以及替代文本（alt text），从而将用户的视觉想法转化为实际的编程成果。

2/8/2025 9:30:22 AM 远洋

微软 GitHub 推出 AI 编程智能体，可自动修复漏洞和优化代码

GitHub在微软Build大会上宣布推出AI编程智能体，集成在GitHub Copilot中，可自动修复漏洞、添加功能和优化文档。该工具已向Copilot企业版和Plus用户开放。#AI编程# #GitHubCopilot#

5/20/2025 12:23:51 AM 远洋

从现在起，GitHub上超1亿开发者可直接访问全球顶级大模型，构建AI应用

GitHub 推出的全新功能「GitHub Models」将有望加快 AI 工程师时代的到来。什么？大家熟悉的代码托管平台 GitHub 又进化了！该平台也开始提供 AI 大模型的 Playgroud 了。所有你能叫得上名字的业界流行大模型，包括微软的 Phi-3、OpenAI 的 GPT-4o、Meta 的 Llama 3.1、Cohere 的 Command R 、Mistral AI 的 Mistral Large，都可以在一个交互式沙盒中试用。在未来几个月，Github 也将添加更多语言、视觉以及其他类型的

8/4/2024 9:48:00 AM 机器之心

DeepSeek“企鹅家族”深夜泄露：512 预算 Emperor 剑指 GPT-5.2，无推理 Mumble 挑战极速响应

相关资讯

GitHub Copilot 推出视觉功能：图片可秒变代码

微软 GitHub 推出 AI 编程智能体，可自动修复漏洞和优化代码

从现在起，GitHub上超1亿开发者可直接访问全球顶级大模型，构建AI应用