首页 > 快讯 > 重大更新!Claude Opus4.1震撼登场，编程性能跃升至74.5%历史峰值!

重大更新!Claude Opus4.1震撼登场，编程性能跃升至74.5%历史峰值!

发布时间：2025-08-06 09:04:20 | 责任编辑：张毅 | 浏览量：494 次

今日，人工智能公司Anthropic正式发布其旗舰模型Claude Opus4的升级版——Claude Opus4.1。此次更新旨在全面提升模型的agentic任务、真实世界编程和推理能力，尤其是在编程和数据分析方面的表现引人注目。
根据官方信息，Claude Opus4.1的最大亮点在于其惊人的编程性能提升。在SWE-bench Verified编程评测中，其表现高达74.5%，这一成绩显示了其在处理复杂代码问题上的强大实力。GitHub的反馈也印证了这一点，开发者们普遍认为Opus4.1在多文件代码重构等任务上表现优于其前身。此外，日本电商巨头Rakuten Group也指出，新模型能够更精准地定位大型代码库中的错误，有效减少不必要的更改和潜在bug。
除了编程能力的飞跃，Opus4.1在深入研究和数据分析方面也有显著进步，特别是在细节追踪和agentic搜索能力上有所加强。Windsurf的基准测试结果显示，Opus4.1的表现比Opus4提升了一个标准差，这一进步幅度堪比Sonnet3.7到Sonnet4的跨越。
尽管此次升级带来了显著的性能提升，但Anthropic强调，Opus4.1属于渐进式改进，并非一次革命性的更新。它将继续按照**AI安全等级3（ASL-3）**标准部署，并在多项安全评估中表现出稳健性。新模型在拒绝违规请求方面的表现略有提升，无害响应率达到了98.76%。
此外，在儿童安全、政治偏见以及代理性能力测试中，Opus4.1的风险水平与前一版本保持一致，并且在极端滥用场景的配合度上降低了约25%，显示出更强的安全性。
Claude Opus4.1现已面向所有付费用户、Claude Code、API、Amazon Bedrock和Google Cloud Vertex AI开放，价格维持与Opus4相同。

是的，Anthropic 于 2025 年 8 月 5 日正式发布了 Claude Opus 4.1，这是 Claude Opus 4 的直接升级版本，在编程、推理和代理任务方面实现了显著增强，尤其在编程能力上取得了新的突破。

核心亮点：

编程能力显著提升：在权威编程基准 SWE-bench Verified 上，Claude Opus 4.1 的得分高达 74.5%，较前代 Opus 4 的 72.5% 提升了 2 个百分点。
更精准的大型代码库导航：在复杂代码库中，Opus 4.1 能够更精准地定位和修改代码，避免不必要的更改或引入新错误，显著提高调试效率。
多文件代码重构能力增强：GitHub 等合作伙伴反馈称，Opus 4.1 在多文件代码重构方面表现尤为突出，性能提升显著。
研究和代理任务能力升级：在细节追踪和代理搜索方面也有明显提升，能更好地处理长时间、复杂的研究任务。

实际应用反馈：

Rakuten Group 发现，Opus 4.1 在大型代码库中能够精确定位需要修正的部分，避免不必要的更改或引入错误，显著提高了日常调试效率。
Windsurf 报告称，Opus 4.1 在其初级开发者基准测试中较 Opus 4 提高了一个标准差，性能提升幅度相当于从 Sonnet 3.7 升级至 Sonnet 4。

获取方式：

Claude 付费用户（Pro、Max、Team）可立即在网页端使用，API 也已开放，开发者可通过 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 获取。
价格保持不变，与 Opus 4 版本一致。

Anthropic 表示，此次升级标志着公司战略转向更频繁的渐进式改进，并计划在未来几周内发布更大幅度的改进版本。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：从私有到共享：OpenAI隆重发布gpt-oss-120b和20b，激起开发者热烈庆祝！

下一篇：谷歌向青少年推出AI笔记应用NotebookLM，教育科技领域竞争再升温

重大更新!Claude Opus4.1震撼登场，编程性能跃升至74.5%历史峰值!

核心亮点：

实际应用反馈：

获取方式：

最新Ai信息

最新Ai工具

热门AI推荐