NVIDIA推出开源巨无霸模型Nemotron 3 Super:性能逼近GPT-5.4水平
发布时间:2026-03-12 16:17:33 | 责任编辑:张毅 | 浏览量:40 次
英伟达(NVIDIA)在AI大模型领域再次投下震撼弹。3月12日,英伟达正式发布了专为AI智能体(Agent)设计的新一代开源大模型——Nemotron3Super。该模型凭借极高的推理效率和卓越的任务成功率,迅速成为开源社区的焦点。
Nemotron3Super采用了创新的 Mamba-MoE 混合架构,参数总量为1200亿,激活参数仅为120亿。这种设计让其在保持强大性能的同时,推理速度提升了3倍,吞吐量更是暴涨5倍。此外,该模型支持高达1M 的超长上下文,有效解决了多智能体协同中常见的“目标跑偏”和“上下文爆炸”问题。
在多项权威测评中,Nemotron3Super表现抢眼。它不仅登顶了 Artificial Analysis 的效率与开放性榜单,更驱动英伟达自研的 AI-Q 智能体在 DeepResearch Bench 双榜位列第一。值得注意的是,该模型在热门智能体任务 OpenClaw 中的成功率高达85.6%,表现已逼近闭源大模型 Claude Opus4.6和 GPT-5.4。
为了充分发挥自研硬件的优势,Nemotron3Super除了支持 BF16和 FP8格式外,还专门针对英伟达最新的 Blackwell 平台及后续架构支持了 NVFP4训练。这一特性将进一步降低大模型的训练成本并提升算力利用率。
目前,Nemotron3Super已被 Perplexity、Palantir、西门子及戴尔等多家科技巨头集成,并同步上线 AWS、Azure 和 Google Cloud 等主流云平台。作为一款开源免费的模型,它为开发者提供了一个低成本、高性能的替代方案,极大地冲击了当前闭源大模型的市场格局。
这是一篇关于NVIDIA发布开源大模型Nemotron 3 Super:性能直逼GPT-5.4的文章,内容值得关注。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
