Claude4登场!Anthropic发布”超越同行”AI模型,编程技能全面领先
发布时间:2025-05-23 10:22:08 | 责任编辑:吴昊 | 浏览量:13 次
在首届开发者大会上,Anthropic推出了两款声称"业界最强"的AI模型,加剧了与OpenAI和谷歌的竞争
Anthropic在周四举行的首届开发者大会上正式发布Claude4模型系列,包括Claude Opus4和Claude Sonnet4两款新模型。该公司声称这些模型在多项流行基准测试中达到业界领先水平,专门针对编程任务进行了优化。
新发布的Claude4系列具备分析大型数据集、执行长期任务和处理复杂操作的能力。两款模型均在编程任务中表现优异,特别适合代码编写和编辑工作。
在用户访问方面,Sonnet4面向所有用户开放,包括免费和付费用户,而功能更强大的Opus4仅限付费用户使用。API定价方面,Opus4收费为每百万代币15美元(输入)/75美元(输出),Sonnet4为3美元(输入)/15美元(输出)。作为参考,一百万代币约相当于75万个单词,超过《战争与和平》的篇幅。
根据Anthropic内部测试,Opus4在编程能力评估SWE-bench Verified测试中超越了谷歌Gemini2.5Pro以及OpenAI的o3和GPT-4.1。不过,在多模态评估MMMU和博士级别科学问题测试GPQA Diamond中,该模型仍未能超越OpenAI的o3。
两款模型均采用"混合"架构,既能快速响应,又能进行深度推理。启用推理模式后,模型会在回答前花更多时间思考解决方案,并展示"用户友好型"思维过程摘要。模型还支持并行使用多种工具,能够提取事实并保存至"记忆"中,逐步构建隐性知识库。
配合新模型发布,Anthropic对Claude Code编程工具进行了重大升级。新版本已与主流IDE集成,并提供SDK支持,允许开发者将其连接至第三方应用程序。该公司还发布了适用于VS Code、JetBrains和GitHub的扩展程序和连接器。
此次发布正值Anthropic寻求大幅提升收入之际。据报道,这家由前OpenAI研究人员创立的公司目标在2027年实现120亿美元收益,相比今年预计的22亿美元大幅增长。公司最近完成25亿美元信贷安排,并从亚马逊等投资者处筹集数十亿美元资金。
面对OpenAI和谷歌等竞争对手不断推出强大模型和开发工具的挑战,Anthropic承诺将转向更频繁的模型更新策略,以保持竞争优势。
值得注意的是,Anthropic对Opus4实施了更严格的安全措施,包括强化有害内容检测器和网络安全防御。公司内部测试发现,该模型可能"大幅提升"具有STEM背景人士获取生产或部署危险武器的能力,达到了Anthropic的"ASL-3"安全规范级别。
尽管AI模型在代码生成方面仍存在安全漏洞和错误等问题,但其提高编码效率的潜力促使企业和开发者快速采用这些技术。随着AI竞赛的不断升级,Anthropic能否凭借Claude4系列在激烈的市场竞争中占据一席之地,值得持续关注。
Anthropic于2025年5月22日正式发布了Claude 4系列模型,包括Claude Opus 4和Claude Sonnet 4。这一系列模型在编程能力上取得了显著突破,被认为在多项关键指标上超越了竞争对手,例如在SWE-bench基准测试中,Claude Opus 4达到了72.5%的准确率,而Claude Sonnet 4达到了72.7%,均高于OpenAI的Codex-1和o3等前沿模型。
编程能力的提升
-
长时间任务处理:Claude Opus 4能够独立且稳定地连续工作7小时,完成复杂的编程任务,这一表现超越了之前OpenAI创造的纪录。这表明其在复杂编码场景中的持续表现能力得到了显著提升。
-
代码编辑与调试:Claude Sonnet 4在代码编辑和调试方面表现出色,能够精确修改多个文件中的代码。
-
解决复杂问题:Claude Opus 4能够解决其他模型无法完成的复杂任务,成功处理了多个前代模型无法完成的关键操作。
技术创新与功能
-
混合架构:Claude 4系列采用“混合”架构,既能快速响应,又能进行深度推理。
-
工具使用与扩展思维:Claude 4能够使用工具(如网络搜索)进行扩展思维,提高响应质量,并支持并行使用多种工具。
-
记忆能力提升:Claude Opus 4能够创建和维护“记忆文件”存储关键信息,提升长期任务的意识和连贯性。
市场与竞争
-
定价策略:Claude Opus 4仅限付费用户使用,每百万代币收费15美元(输入)/75美元(输出),而Claude Sonnet 4面向所有用户开放,收费为3美元(输入)/15美元(输出)。
-
商业目标:Anthropic的目标是在2027年实现120亿美元收益,相比今年预计的22亿美元大幅增长。
安全性
Claude 4系列被归类为ASL-3安全等级,Anthropic采取了多项措施以降低潜在风险,包括引入“思维摘要”功能,以提高模型的可解释性和透明度。
总体来看,Claude 4系列模型在编程能力上的提升,使其在AI开发领域树立了新的标杆,同时也加剧了与OpenAI和谷歌等竞争对手的竞争。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。