首页 > 快讯 > 寒武纪完成DeepSeek-V4全系列模型Day0适配，优化代码同步开源

寒武纪完成DeepSeek-V4全系列模型Day0适配，优化代码同步开源

发布时间：2026-04-24 16:23:02 | 责任编辑：张毅 | 浏览量：5 次

寒武纪今日宣布，已基于 vLLM 推理框架完成对深度求索（DeepSeek）最新开源模型DeepSeek-V4全系列的“Day0”适配。此次改装涵盖285B 参数的 Flash 版本及1.6T 参数的 Pro 版本，确保模型在发布当日即可在寒武纪硬件平台上稳定运行，相关改装代码已正式开源至 GitHub 社区。
针对DeepSeek-V4独有的稀疏注意力与压缩结构，寒武纪通过自研向量融合算子库 Torch-MLU-Ops 对 Compressor 等核心模块进行了专项加速。利用 BangC 高性能编程语言，寒武纪团队编写了稀疏 Attention 及 GroupGemm 等热点算子的极致优化内核，并于 vLLM 框架中全面支持 TP/PP/SP/DP/EP 五维混合并行策略、低精度量化及 PD 分离部署。这些技术手段在满足延迟约束的前提下，显著提升了端到端推理的词元吞吐能力。
硬件层面，寒武纪深度挖掘了 MLU 的访存与排序加速特性，有效应对DeepSeek-V4复杂的索引结构。凭借高互联带宽与低延迟通信优势，该方案最大化降低了 Prefill 与 Decode 场景下的通信损耗，提升了推理利用率。
行业分析指出，DeepSeek-V4凭借百万字（1M）超长上下文及顶尖的逻辑推理性能，对底层算力架构提出了严苛要求。寒武纪在模型发布首日的敏捷适配，不仅展示了国产算力平台对超大规模、复杂结构模型的承载能力，也预示着国产 AI 产业链在软硬协同层面已进入成熟期，为大模型应用普惠提供了高效的算力底座支持。

这是一篇关于寒武纪宣布实现 DeepSeek-V4全系列模型 Day0适配并开源优化代码的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇： Perplexity CEO 指出，AI 浪潮不会取代 iPhone，反而会巩固其核心地位。

下一篇：谷歌高管揭秘：九成游戏开发商已暗中采用AI技术

寒武纪完成DeepSeek-V4全系列模型Day0适配，优化代码同步开源

最新Ai信息

最新Ai工具

热门AI推荐