首页 > 快讯 > 深夜泄露的DeepSeek“企鹅家族”：512 预算的 Emperor 目标直指 GPT-5.2，无推理 Mumble 追求极致响应速度

深夜泄露的DeepSeek“企鹅家族”：512 预算的 Emperor 目标直指 GPT-5.2，无推理 Mumble 追求极致响应速度

发布时间：2025-12-04 18:39:42 | 责任编辑：张毅 | 浏览量：262 次

12月4日凌晨，GitHub 与 DesignArena 同步流出 OpenAI 内部代号“企鹅”（Penguin）的全新模型矩阵，四档推理预算首次曝光:旗舰 Emperor512、中端 Rockhopper64、轻量 Macaroni16与零推理 Mumble0，覆盖从云端到边缘的全场景需求。
512推理预算!Emperor 或成 GPT-5.2核心
内部文件显示，Emperor 拥有512单位“juice”推理预算，为现行模型8-10倍，端到端延迟却控制在80ms 以内，实现“零等待”对话体验;代码路径已嵌入实时剪枝与动态计算分配，疑似为明年 GPT-5.2提供底层架构。
四档预算=四种 latency:Macaroni 主打极速，Mumble 彻底去推理
- Rockhopper（64）(中端)定位“推理+速度”平衡，目标替代 GPT-4.5
- Macaroni（16）面向移动端，首次在8Gen3芯片跑通70B 模型
- Mumble（0）完全跳过推理步骤，响应时间<50ms，用于高频自动完成与语音打断场景
记忆搜索同步曝光:一键召回对话上下文
同批泄露的代码显示，ChatGPT 将新增“Memory Search”按钮，用户输入自然语言即可即时检索历史记忆，无需再手动翻找聊天记录;该功能已内测，预计与企鹅家族模型一同上线。
Shallotpeat & Garlic 接踵而至:OpenAI 拉响红色警报
The Information 补充，OpenAI 下周或发布内部代号 Shallotpeat 的新推理模型，性能已领先 Gemini3;另一款 Garlic 完成预训练，2026年初以 GPT-5.2/5.5形式推出，主打“小参数+高密度知识”路线，直接对标谷歌“预训练飞跃”。
行业震荡:开源与闭源同时提速
- 对于开发者，四档预算意味着同一代号即可调用“延迟-成本-精度”不同组合，API 定价有望下探30%
- 对于竞品，OpenAI 首次把“推理 budget”做成明码标价，迫使 Google、Anthropic 跟进类似分级
- 对于监管，零推理 Mumble 的极速响应可能放大错误率，安全评估或成为发布前最后一道关卡
OpenAI 尚未公布企鹅家族具体发布日期，但已在 DesignArena 开启盲测，获胜模型将直接并入 ChatGPT Plus 与 Enterprise 通道。小编将持续跟踪，第一时间带来基准成绩与 API 定价细节。

这是一篇关于DeepSeek“企鹅家族”深夜泄露：512 预算 Emperor 剑指 GPT-5.2，无推理 Mumble 挑战极速响应的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：罗永浩为字节“豆包手机”点赞：认同其探索精神，并坚信AI助手的普及是历史发展的趋势

下一篇：李康旭获任三星新设AI研究机构首长职位

深夜泄露的DeepSeek“企鹅家族”：512 预算的 Emperor 目标直指 GPT-5.2，无推理 Mumble 追求极致响应速度

最新Ai信息

最新Ai工具

热门AI推荐