首页 > 快讯 > DeepSeek推出V3.1版本,将上下文窗口扩大至128K tokens

DeepSeek推出V3.1版本,将上下文窗口扩大至128K tokens

发布时间:2025-08-19 21:00:38 | 责任编辑:张毅 | 浏览量:11 次

北京,2025年8月19日 — DeepSeek今日正式发布其旗舰大语言模型的最新迭代版本DeepSeek-V3.1,该版本在保持完全API兼容性的前提下,将上下文窗口容量从64k tokens大幅扩展至128k tokens,标志着该公司在开源AI技术领域的又一重要里程碑。
DeepSeek-V3.1距离前一版本DeepSeek-V3-0324的发布仅相隔五个月时间。V3-0324版本于今年3月发布,在推理能力、编程效率和数学计算等核心性能指标方面实现了显著提升,为本次V3.1版本的进一步优化奠定了坚实基础。
在当前全球AI技术竞争日趋激烈的背景下,DeepSeek的快速产品迭代策略充分展现了其技术创新能力和市场响应速度。尽管面临国际制裁带来的高端计算资源获取限制,DeepSeek依然通过创新的高效训练方法和优化策略,在开源大语言模型领域保持了强劲的竞争优势。
扩展上下文处理能力:V3.1版本的核心升级在于上下文窗口的翻倍扩容,使模型能够处理更长的多轮对话序列和复杂的查询任务,为用户提供更连贯和深入的交互体验。
优化输出结构:根据早期用户反馈,V3.1在语言表达风格方面进行了显著优化,模型现在更倾向于生成结构化输出内容,包括表格、列表等格式化数据呈现,提升了信息的可读性和实用性。
增强物理理解能力:新版本在物理现象模拟和相关概念理解方面表现出明显改进,为科学计算和工程应用场景提供了更强的支撑能力。
架构延续与优化:V3.1继续采用经过验证的专家混合(MoE,Mixture of Experts)架构设计,针对常规推理任务进行了专门优化,在此类应用场景下无需启用"DeepThink"深度思考模式,既保证了处理效率又维持了输出质量。
DeepSeek-V3.1目前已在多个平台同步上线,包括DeepSeek官方网站、移动应用程序以及微信小程序等主要用户接入渠道。该公司特别强调了API接口的完全向后兼容性,确保现有用户和开发者能够无缝迁移至新版本,无需修改现有的集成代码或调用方式。
虽然截至发稿时,Hugging Face平台尚未提供V3.1版本的模型权重文件下载,但DeepSeek重申了其对开源社区的长期承诺,承诺将继续遵循开源发布策略,为全球AI研究社区和开发者提供技术支持。
DeepSeek-V3.1的发布进一步巩固了该公司在中国AI技术创新领域的领先地位,也为全球开源大语言模型的发展贡献了重要的技术进步。随着上下文处理能力的显著提升和多项性能优化的实现,V3.1有望在企业级应用、学术研究和个人用户场景中发挥更大的价值。

DeepSeek推出V3.1版本,将上下文窗口扩大至128K tokens

DeepSeek 已于 2025 年 8 月 19 日正式将线上模型升级至 V3.1 版本,核心改进是将上下文窗口长度从原来的 64K tokens 拓展至 128K tokens,实现翻倍提升。

此次升级意味着:

  • 更长的文本处理能力:可以一次性处理约 10 万汉字长度的文本,适用于超长文档分析、复杂代码库理解、长对话一致性保持等场景。

  • 无需调整 API:用户通过官方网页、App、小程序即可直接体验新版本,API 接口调用方式保持不变。

  • 技术实现:通过引入动态稀疏注意力机制(DSA)、基于熵的窗口压缩技术(EBWC)以及改进的 YaRN 位置编码扩展方法,显著降低了长文本处理时的内存占用与计算复杂度。

目前,用户只需登录 DeepSeek 官方网页、App 或小程序,关闭“深度思考”模式即可直接体验新版模型。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐