从私有到共享:OpenAI隆重发布gpt-oss-120b和20b,激起开发者热烈庆祝!
发布时间:2025-08-06 09:00:25 | 责任编辑:吴昊 | 浏览量:4 次
OpenAI宣布推出两款开源权重语言模型——gpt-oss-120b和gpt-oss-20b,这是自2019年GPT-2发布以来,OpenAI首次回归开源领域。此举不仅标志着OpenAI战略的重大转向,也为全球AI开发者提供了强大的推理工具,加速AI技术的普及与创新。
根据OpenAI官方公告,gpt-oss-120b和gpt-oss-20b采用Apache2.0许可证发布,允许开发者自由下载、修改和用于商业用途。这两款模型分别是1170亿参数和210亿参数的混合专家(MoE)架构,分别激活51亿和36亿参数,兼顾高效推理与低资源消耗。
这些模型支持长达128k token的上下文长度,采用交替密集和局部带状稀疏注意力机制,并使用分组多查询注意力技术以提升推理效率。OpenAI还开源了‘o200k_harmony’分词器,进一步降低开发门槛。
OpenAI在发布中强调,安全是gpt-oss系列的核心原则。针对开源模型可能被恶意微调的风险,OpenAI对gpt-oss-120b进行了对抗性微调测试,并通过其“准备框架”(Preparedness Framework)验证,确认即使经过恶意优化,模型在生物、化学及网络安全领域也未达到高风险能力水平。外部安全专家的审查进一步提升了模型的安全标准。
此外,OpenAI呼吁开发者在使用模型时,结合自身需求实施额外安全措施,以应对多样化应用场景中的潜在风险。模型卡和研究论文中详细披露了安全测试结果,为开源社区提供了透明参考。
OpenAI此举被认为是应对开源领域竞争的战略调整。近年来,Meta、DeepSeek等公司通过开放模型抢占市场,迫使OpenAI重新审视其闭源策略。OpenAI首席执行官Sam Altman在Reddit AMA中曾表示,公司过去的开源路线“走错了方向”,此次发布则是兑现其回归开源承诺的第一步。
同时,gpt-oss系列满足了企业对本地化部署和数据隐私的需求。金融、医疗、法律等高监管行业可将模型部署在私有服务器上,避免数据泄露风险。OpenAI还与瑞典国家人工智能中心AI Sweden等机构合作,探索区域性微调以提升模型在特定语言和文化背景下的表现。
gpt-oss系列支持多种开发框架,如Transformers、vLLM、Ollama和llama.cpp,开发者可通过Hugging Face、GitHub等平台下载模型权重,并利用OpenAI提供的参考代码快速上手。模型内置链式推理(Chain-of-Thought)、工具调用(支持Python代码执行、网页搜索等)及结构化输出(JSON、YAML等),特别适合构建智能体工作流。
此外,模型支持三种推理等级(低、中、高),开发者可根据任务需求平衡速度与精度。
gpt-oss的发布不仅为开发者提供了高性能、低成本的AI工具,也对AI行业格局产生了深远影响。相较于Meta的Llama或DeepSeek的R1,gpt-oss在推理能力和工具使用上具有明显优势,但其文本单模态的限制也意味着需通过API调用补充多模态功能。
OpenAI表示,未来将根据社区反馈持续优化gpt-oss系列,但未承诺具体更新计划。业内专家认为,此举可能推动更多企业采用混合AI策略,即结合开源模型与云端服务,兼顾成本与灵活性。
官方博客:https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/
今天(2025-08-06),OpenAI 正式官宣两款开源权重语言模型——GPT-oss-120b 与 GPT-oss-20b。这是继 2019 年 GPT-2 之后,OpenAI 六年来首次“真·开源”,被 CEO Sam Altman 称为“全球最佳开放模型”。
1. 模型定位与性能
指标 | GPT-oss-120b | GPT-oss-20b |
---|---|---|
总参数量 | 1170 亿 | 210 亿 |
激活参数 | 51 亿 | 36 亿 |
对标闭源 | ≈ o4-mini | ≈ o3-mini |
运行硬件 | 单张 80 GB GPU(如 H100) | 16 GB 显存的消费级 GPU |
适用场景 | 数据中心、高性能台式机 | 笔记本、边缘设备、本地化快速迭代 |
在多项基准(Codeforces、HealthBench、Tau-Bench 等)中,120b 甚至超过了 o4-mini,20b 则与 o3-mini 持平。
2. 开源细节
-
协议:Apache 2.0——可商用、免授权费、无专利风险。
-
获取方式:
-
GitHub 开源推理代码:github.com/openai/gpt-oss。
-
在线体验:www.gpt-oss.com。
3. 开发者狂欢点
-
本地运行:无需联网、无 API 费用,隐私完全自主。
-
可微调:支持 LoRA/全参微调,可深度定制。
-
完整思维链:可查看模型推理过程,便于调试(默认关闭,需手动开启)。
-
与闭源联动:当开源模型无法胜任(如图像任务)时,可无缝调用 OpenAI 云端更强模型。
4. 行业反响
-
亚马逊 Bedrock、SageMaker 已宣布第一时间接入,提供托管服务。
-
北大、清华等高校实验室连夜放出部署教程,社区出现“30 分钟本地跑 20b”教程刷屏。
-
网友调侃:“今天 AI 圈神仙打架,OpenAI 开源、Anthropic 发 Claude Opus 4.1、谷歌推 Genie 3,显卡告急!”
一句话总结:OpenAI 用“真开源”回应了近年 Meta、Mistral、DeepSeek 等开放权重阵营的挑战,开发者迎来零门槛、可商用、高性能的新基座模型。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。