首页 > 快讯 > DeepSeek-V3.1上线:提升思考效能 优化Agent性能

DeepSeek-V3.1上线:提升思考效能 优化Agent性能

发布时间:2025-08-21 16:08:17 | 责任编辑:张毅 | 浏览量:6 次

8月21日,深度求索科技有限公司正式发布了其最新版本的AI模型——DeepSeek-V3.1。此次升级标志着公司在迈向Agent时代方面迈出了坚实的第一步,为用户提供了一个更加强大、高效且多功能的人工智能解决方案。
DeepSeek-V3.1的发布带来了多项重大改进。首先,该版本引入了混合推理架构,使得一个模型能够同时支持思考模式与非思考模式,为用户提供了更灵活的选择。在思考模式下,DeepSeek-V3.1-Think相较于之前的DeepSeek-R1-0528版本,能够在更短的时间内给出答案,显著提高了思考效率。此外,通过Post-Training优化,新模型在工具使用与智能体任务中的表现也得到了大幅提升。
为了更好地服务用户,官方App与网页端模型已同步升级至DeepSeek-V3.1。用户可以通过点击“深度思考”按钮,轻松实现思考模式与非思考模式之间的自由切换。同时,DeepSeek API也进行了同步升级,其中`deepseek-chat`对应非思考模式,`deepseek-reasoner`对应思考模式,且上下文容量已扩展至128K。此外,API Beta接口还新增了对`strict`模式的Function Calling支持,确保输出的Function满足schema定义。
DeepSeek-V3.1还增强了对Anthropic API格式的支持,使得用户能够轻松地将该模型的能力接入Claude Code框架。这为开发者提供了更大的灵活性,进一步拓展了模型的应用场景。
在工具调用和智能体支持方面,DeepSeek-V3.1也取得了显著进步。在编程智能体测评中,无论是使用内部框架还是在命令行终端环境下进行复杂任务测试,DeepSeek-V3.1相较于之前的版本都有了明显的提升。在搜索智能体测评中,DeepSeek-V3.1在多项指标上也取得了较大提升,尤其是在需要多步推理的复杂搜索测试和多学科专家级难题测试中,其性能已大幅领先于之前的版本。
此外,DeepSeek-V3.1在思考效率方面也进行了优化。经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时,在非思考模式下,V3.1也能够有效控制输出长度,保持与之前版本相同的模型性能。
为了进一步推动技术的开源与共享,DeepSeek-V3.1的Base模型已在Huggingface和魔搭平台开源。Base模型在V3的基础上重新进行了外扩训练,增加了840B tokens的训练量。
在价格方面,深度求索科技有限公司宣布,自北京时间2025年9月6日凌晨起,将对DeepSeek开放平台API接口调用价格进行调整,执行新版价格表,并取消夜间时段优惠。在9月6日前,所有API服务仍按原价格政策计费,用户可继续享受当前优惠。同时,公司已进一步扩容API服务资源,以更好地满足用户的调用需求。
开源链接:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
官方文档:
https://api-docs.deepseek.com/zh-cn/guides/anthropic_api

DeepSeek-V3.1上线:提升思考效能 优化Agent性能

DeepSeek-V3.1 已于 2025 年 8 月 21 日正式发布。本次升级带来了三个核心亮点:

  1. 混合推理架构:一个模型同时支持“思考模式”(逐步推理)和“非思考模式”(快速响应)。用户可在官方 App、网页端通过“深度思考”按钮自由切换。

  2. 更高的思考效率:在保持与上一代模型 R1-0528 相当的基准表现(AIME、GPQA、liveCodeBench 等)的同时,DeepSeek-V3.1-Think 输出 Token 数减少 20%–50%,显著缩短响应时间。

  3. 更强的 Agent 能力:通过 Post-Training 优化,模型在工具调用与智能体任务中的表现大幅提升。

    • 编程智能体:在代码修复(SWE)和终端复杂任务(Terminal-Bench)测试中,相比开源框架 OpenHands 所需轮次更少。

    • 搜索智能体:在多步推理复杂搜索(browsecomp)及多学科专家级难题(HLE)测试中,性能大幅领先 R1-0528。

此外,DeepSeek-V3.1 的 API 已同步升级:

  • 上下文长度扩展至 128K,并支持 strict 模式的 Function Calling,确保输出符合 schema 定义。

  • 价格调整:自 2025 年 9 月 6 日起,API 调用价格将调整为输入 0.5 元/百万 Tokens(缓存命中)或 4 元/百万 Tokens(缓存未命中),输出 12 元/百万 Tokens。

用户现可通过官方 App、网页端及 API(deepseek-chat 对应非思考模式,deepseek-reasoner 对应思考模式)体验 DeepSeek-V3.1 的全新功能。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐