智谱 GLM-5 “不经意”泄露?采用 DeepSeek 技术体系引发性能飞跃,市值飙升200%,稳居国产AI领先行列
发布时间:2026-02-11 11:32:43 | 责任编辑:吴昊 | 浏览量:5 次
国产大模型赛道在2026年春节期间爆点频出。继 DeepSeek 成为现象级产品后,智谱 AI 的新一代大模型 GLM-5 也揭开了神秘面纱。 这一动作直接引爆资本市场,智谱股价近期大涨 200%,总市值冲至1500亿港币,达 IPO 时的3倍之多。
马甲曝光:神秘模型“Pony Alpha”即为 GLM-5
前几日,全球模型服务平台 OpenRouter 上出现了一款代号为 “Pony Alpha” 的匿名模型,因其代码编写能力直逼 Claude Opus 而引发全球热议。
身份确认:该模型的系统提示词自曝为 GLM 身份。
“指纹”识别:网友通过验证 GLM 家族特有的逻辑 Bug(如输入“锅内倒入植物油烧热”得到特定异常答案),几乎可以断定其归属。
核心黑科技:复用 DeepSeek 架构,参数翻倍
GLM-5在技术路线上选择了与DeepSeek-V3相同的稀疏注意力架构 (DSA),这被视为一种极具性价比的演进策略。
规模跨越:总参数量高达 745B,是前代 GLM-4.7的2倍。
计算效率:拥有256个专家,每次激活8个(约44B 激活参数),稀疏度仅为5.9%。
长文本与多模态:支持最高 202K token 的上下文窗口。 同时,针对2026年的市场需求,GLM-5强化了视频理解等多模态能力,补齐了此前DeepSeek纯文本架构的短板。
行业影响:部署门槛进一步降低
由于采用了 DSA 架构,GLM-5可以直接复用 vLLM、SGLang 等主流推理框架的现有优化方案。 这意味着企业级用户在部署该模型时,技术门槛和算力成本将大幅降低。
在国产 AI “偷家”海外大模型的浪潮中,智谱凭借 GLM-5的强悍表现,再次证明了其在模型性能与工程实现上的顶尖实力。
这是一篇关于智谱 GLM-5 意外“泄露”?复用 DeepSeek 架构性能炸裂,市值狂飙 200% 坐稳国产 AI 顶流的文章,内容值得关注。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
