首页 > 问答 > DeepSeek的训练成本是多少?

DeepSeek的训练成本是多少?

发布时间:2025-05-07 10:33:26 | 责任编辑:问号 | 浏览量:12 次

根据最新的搜索结果,DeepSeek-V3的训练成本为557.6万美元。这一成本包括三个阶段:预训练(pre-training)、扩展上下文(context extension)和后训练(post-training),总计耗费了278.8万GPU小时。具体计算公式如下:






训练成本

=



GPU
小时数

×




GPU
小时租赁价格




假设H800 GPU的租赁价格为2美元/小时,计算得出总成本为557.6万美元。

需要注意的是,这557.6万美元的训练成本并不包括前期研究、架构设计、算法优化以及数据准备等“隐性成本”。此外,DeepSeek-V3的训练成本之所以相对较低,主要得益于其在算法优化、硬件资源管理和训练效率提升方面的创新。例如,DeepSeek采用了混合精度训练策略(如FP8训练框架),显著提高了训练效率。

相比之下,其他大规模模型的训练成本更高。例如,Llama 3.1 405B的预训练阶段耗费了约5800万美元,而根据估算,与GPT-4规模相当的模型训练成本约为4800万至6300万美元。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复