首页 > 快讯 > DeepSeek向腾讯技术团队公开表达感激之情,推动DeepSeek通信架构性能翻倍提升

DeepSeek向腾讯技术团队公开表达感激之情,推动DeepSeek通信架构性能翻倍提升

发布时间:2025-05-08 10:05:20 | 责任编辑:吴昊 | 浏览量:21 次

DeepSeek近日发文公开致谢腾讯技术团队,称其对DeepSeek开源通信框架DeepEP的优化是一项“huge speedup”级别的代码贡献。
此次优化聚焦于在多种网络环境下提升通信性能。经测试,优化后的DeepEP在RoCE网络环境下性能提升高达100%,在IB(InfiniBand)网络环境下提升约30%,显著增强了通信效率,为AI大模型训练提供了更稳定、高效的底层支撑。
腾讯技术团队的这一贡献不仅推动了DeepEP性能的实质飞跃,也为更多企业部署大规模AI训练任务提供了可复用的技术范式。
DeepSeek强调,这一成果不仅源于开源社区的协作精神,更展示了腾讯在底层通信技术上的深厚实力。
如果你需要为这条新闻制作视频脚本或社媒文案,也可以继续告诉我。是否还需要配图推荐?

DeepSeek向腾讯技术团队公开表达感激之情,推动DeepSeek通信架构性能翻倍提升

5月7日,DeepSeek公开致谢腾讯技术团队,称其对DeepSeek开源通信框架DeepEP的优化是一项“huge speedup”级别的代码贡献。此次优化聚焦于在多种网络环境下提升通信性能,经测试,优化后的DeepEP在RoCE网络环境下性能提升高达100%,在IB(InfiniBand)网络环境下提升约30%,显著增强了通信效率,为AI大模型训练提供了更稳定、高效的底层支撑。

DeepSeek于今年2月开源了包括DeepEP在内的五大代码库,展示了如何利用有限的硬件资源实现接近万卡集群的性能。DeepEP凭借突破性的方法提升了300%的通信效率,成功解决了MoE架构大模型对英伟达NCCL的依赖问题。然而,该技术在成本较低、适用面更广的RoCE网络环境中表现不佳,限制了其在更广泛场景的应用。腾讯星脉网络团队基于在RoCE网络领域的深厚积累,在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。

腾讯在RoCE网络优化方面的突破,首先体现在带宽分配的智能化,通过拓扑感知的多QP建链技术,智能分配数据流,优化了双端口网卡的带宽利用率,确保每条数据通道都能得到充分使用。此外,腾讯还通过绕过CPU控制面和原子化信令协同等技术手段,进一步提升了通信效率。在腾讯的技术优化下,DeepEP不仅在RoCE网络实现性能翻倍,反哺到IB网络时更使原有通信效率再提升30%。

目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的环境中,展现出出色的通用性。DeepSeek强调,这一成果不仅源于开源社区的协作精神,更展示了腾讯在底层通信技术上的深厚实力。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复