首页 > 快讯 > IBM 推出专为边缘AI设计的微缩开源模型:Granite4.0Nano系列

IBM 推出专为边缘AI设计的微缩开源模型:Granite4.0Nano系列

发布时间:2025-10-30 15:08:54 | 责任编辑:张毅 | 浏览量:5 次

近日,IBM AI 团队推出了 Granite4.0Nano 系列,这是一个专为本地和边缘推理而设计的小型模型家族,旨在为企业提供更强的控制能力和开源许可。该系列包含8个模型,分为350M 和约1B 两种规模,采用混合 SSM 和变换器架构,支持基本和指令两种模式,所有模型均在 Apache2.0许可下发布,且能够在 vLLM、llama.cpp 和 MLX 等流行运行时环境中原生运行。
Granite4.0Nano 系列包括四条模型线及其基础版本。其中,Granite4.0H1B 采用混合 SSM 架构,参数数量约为1.5B;而 Granite4.0H350M 同样采用混合方法,参数数量为350M。为了确保最大的运行时兼容性,IBM 还提供了 Granite4.01B 和 Granite4.0350M 的变换器版本。
这些 H 变体模型交替使用 SSM 层和变换器层设计,这种混合结构在内存增长方面相较于纯变换器有显著优势,同时保持了变换器模块的通用性。Granite4.0Nano 模型没有采用减少数据管道,而是遵循与大规模 Granite4.0模型相同的训练方法,使用超过15万亿个标记进行训练,并经过指令调整,以提高工具使用和指令遵循能力。
IBM 还将 Granite4.0Nano 与其他同类模型进行了比较,包括 Qwen、Gemma 和 LiquidAI LFM,结果显示在通用知识、数学、代码及安全性等领域,Granite4.0Nano 的表现显著提升。此外,该系列模型在代理任务上也在 IFEval 和伯克利函数调用排行榜第3版中表现出色。
这些模型经过 ISO42001认证,并且以加密签名的形式发布,确保了企业级使用所需的可追溯性和治理能力。用户可以通过 Hugging Face 和 IBM watsonx.ai 访问这些模型,并在边缘、本地和浏览器级别上进行部署,帮助早期 AI 工程师和软件团队更好地实现项目。
huggingface:https://huggingface.co/collections/ibm-granite/granite-40-nano-language-models
划重点:
🔹 IBM 发布了 Granite4.0Nano 系列,包含8个模型,适用于边缘 AI 推理。
🔹 该系列模型基于超过15万亿个标记进行训练,确保了性能的继承性。
🔹 所有模型均经过 ISO42001认证,并具有企业级治理能力,支持多种运行环境。

IBM 推出专为边缘AI设计的微缩开源模型:Granite4.0Nano系列

这是一篇关于IBM 发布 Granite4.0Nano 系列:为边缘 AI 量身打造的小型开源模型的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐