首页 > 快讯 > 新型智能模型 Nemotron-Nano-9B-v2 由 Nvidia 发布,兼容智能推理切换功能

新型智能模型 Nemotron-Nano-9B-v2 由 Nvidia 发布,兼容智能推理切换功能

发布时间:2025-08-19 10:42:20 | 责任编辑:张毅 | 浏览量:8 次

近日,Nvidia 推出了一款新的小型语言模型 Nemotron-Nano-9B-v2,这款模型在多个基准测试中表现优异,并且用户可以灵活控制其推理功能的开关。Nemotron-Nano-9B-v2的参数量为90亿,相较于其前身的120亿参数有了显著减小,旨在适应单个 Nvidia A10GPU 的部署需求。
Nvidia 的 AI 模型后训练总监 Oleksii Kuchiaev 表示,这款模型专门针对 A10GPU 进行了优化,可以实现高达6倍的处理速度,适合各种应用场景。Nemotron-Nano-9B-v2支持多种语言,包括英语、德语、西班牙语、法语、意大利语、日语,以及扩展的韩语、葡萄牙语、俄语和中文等,适用于指令跟随和代码生成任务。
该模型基于 Nemotron-H 系列,融合了 Mamba 与 Transformer 架构,能够在处理长序列时降低内存和计算需求。与传统的 Transformer 模型不同,Nemotron-H 模型使用选择性状态空间模型(SSM),在确保准确性的同时,能够高效处理更长的信息序列。
在推理功能上,Nemotron-Nano-9B-v2可以默认生成推理过程的跟踪记录,用户也可以通过简单的控制指令,如 /think 或 /no_think,来切换这一功能。此外,模型引入了运行时 “思考预算” 管理,允许开发者设定推理所用的最大 token 数量,以便在准确性和响应速度之间取得平衡。
在基准测试中,Nemotron-Nano-9B-v2展现了良好的准确性。例如,在使用 NeMo-Skills 套件的 “推理开启” 模式下,该模型在多个测试中均表现出色,显示出与其他小型开源模型相比的优势。
Nvidia 将 Nemotron-Nano-9B-v2以开放模型许可证发布,允许商业用途,且开发者可自由创建和分发衍生模型。值得一提的是,Nvidia 不会对模型生成的输出主张所有权,用户可完全控制其使用。
该模型的发布旨在为开发者提供在小规模环境中平衡推理能力和部署效率的工具,标志着 Nvidia 在提高语言模型的效率和可控推理能力方面的持续努力。
huggingface:https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2
划重点:
🌟 Nvidia 推出了新型小型语言模型 Nemotron-Nano-9B-v2,支持用户灵活控制推理功能。
⚙️ 该模型基于先进的混合架构,能够高效处理长序列信息,适用于多语言任务。
📊 Nemotron-Nano-9B-v2以开放模型许可证发布,允许开发者进行商业用途和衍生模型的创建。

新型智能模型 Nemotron-Nano-9B-v2 由 Nvidia 发布,兼容智能推理切换功能

Nvidia 最新发布的 Nemotron-Nano-9B-v2 是一款专为单张 A10 GPU 优化、仅 90 亿参数的高效小型语言模型。它采用 Mamba-2/Transformer 混合架构,通过选择性状态空间模型(SSM)以线性复杂度处理超长序列(支持 128k 上下文),在 8k 输入/16k 输出场景下可达到 6 倍于同规模 Transformer 的吞吐量

核心亮点:智能推理开关

  • 按需推理:用户可通过简单的控制符
    /think

    /no_think
    开启或关闭模型的内部推理过程

  • 思考预算:支持运行时“思考预算”管理,开发者可设置模型用于内部推理的最大 token 数量,在准确性响应速度之间灵活平衡。

多语言与商用开放

  • 支持语言:中文、英语、德语、法语、日语、韩语等 9 种语言,擅长指令跟随代码生成

  • 开源商用:遵循 NVIDIA 开放模型许可协议完全免费商用,无需支付版税,模型、预训练数据集及技术报告均已上传 Hugging Face

性能验证

GSM8K、MATH、HumanEval+、MMLU-Pro、RULER-128k 等基准测试中,Nemotron-Nano-9B-v2 的准确率 持平或优于 Qwen3-8B、Gemma3-12B 等同级开源模型。

综上,Nemotron-Nano-9B-v2 以其高效、可控的推理能力,为开发者提供了在本地或边缘环境中部署高性能 AI 应用的理想选择。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐