OpenAI推出GPT-4.1家族模型:性能实现全方位升级,超越前作
发布时间:2025-04-15 08:49:13 | 责任编辑:字母汇 | 浏览量:14 次
《OpenAI推出GPT-4.1家族模型:性能实现全方位升级,超越前作》相关软件官网

4月15日,OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型,涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。该系列在编程能力、指令理解及长文本处理等方面实现重大突破,全面超越前代 GPT-4o 及 GPT-4o mini。其中,模型上下文窗口扩展至100万 tokens,知识库更新至2024年6月,为复杂任务提供更强支持。
GPT-4.1系列目前仅面向开发者开放,通过 API 接口提供服务,普通用户暂无法直接通过 ChatGPT 界面体验。OpenAI 透露,GPT-4.1在编程场景中代码生成速度较 GPT-4o 提升40%,同时用户查询成本降低80%,显著优化开发效率与成本。
性能表现:多项基准测试刷新纪录
GPT-4.1mini 在多项测试中表现接近甚至超越 GPT-4o,延迟降低近50%,成本减少83%。而 GPT-4.1nano 作为轻量化版本,以100万 tokens 上下文窗口和80.1% 的 MMLU 得分,成为分类与自动补全任务的性价比之选。通过推理栈优化与提示缓存技术,系列模型首次响应时间大幅缩短,为开发者提供高效低成本的解决方案。
实际应用场景成效显著
GPT-4.1输入费用为每100万 tokens2美元(约合人民币14.6元),输出费用为8美元(约合人民币58.3元)。在中等查询场景中,GPT-4.1较 GPT-4o 性能提升的同时,成本降低26%。其中,GPT-4.1nano 凭借超低延迟与成本,成为 OpenAI 当前最经济的模型选择。
OpenAI于2025年4月14日发布了GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 Mini和GPT-4.1 Nano三个版本,这些模型在多个方面全面超越了前代。
主要性能提升
- 编码能力:GPT-4.1在SWE-bench Verified基准测试中得分54.6%,相比GPT-4o提升了21.4%,相比GPT-4.5提升了26.6%,使其成为编码领域的领先模型。
- 指令遵循能力:在Scale的MultiChallenge基准测试中,GPT-4.1得分38.3%,比GPT-4o提升了10.5%。该模型能够更准确地遵循复杂指令。
- 长文本处理能力:GPT-4.1系列支持长达100万tokens的上下文窗口,在Video-MME多模态长文本理解基准测试中,GPT-4.1在“长文本、无字幕”类别中得分72.0%,比GPT-4o提升了6.7%。
成本与效率
- 成本降低:GPT-4.1在处理大规模文档时不会额外收费。GPT-4.1 Mini和Nano版本则进一步降低了成本,其中Nano版本是OpenAI迄今为止最小、最快、最便宜的模型。
- 效率提升:GPT-4.1 Mini的延迟降低了近一半,成本降低了83%,同时在智能评估中与GPT-4o持平或超过。GPT-4.1 Nano则更适合低延迟和成本效率高的任务。
其他改进
- 输出优化:GPT-4.1能够更好地遵循函数调用格式、JSON结构和格式规则,减少了不必要的代码输出。
- 知识更新:所有GPT-4.1模型的知识截止日期为2024年6月,使其能够处理更近期的事件和信息。
适用场景
GPT-4.1系列模型主要面向开发者,适用于从全栈编码到实时轻量级用例的多种场景。例如,GPT-4.1能够生成完整的Web应用程序,而Mini和Nano版本则更适合分类、自动补全等任务。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。