Granite 4.0 Nano 模型由 IBM 推出,挑战小型 AI 系统性能新高度
发布时间:2025-10-29 10:31:30 | 责任编辑:张毅 | 浏览量:5 次
近日,IBM 推出了四款新的 Granite4.0Nano 模型,这一系列模型的参数规模从350万到15亿不等,展示了公司在人工智能领域对高效与可及性的重视。与行业中大型模型普遍依赖云计算的趋势不同,Granite4.0Nano 模型可以在普通的笔记本电脑上运行,甚至可以在浏览器中本地运行。这使得开发者能够在不依赖云服务的情况下,构建适用于消费者硬件或边缘设备的应用。
所有 Granite4.0Nano 模型均在 Apache2.0许可下发布,适合研究人员、企业和独立开发者使用,且支持商业用途。这些模型与各种工具兼容,如 llama.cpp、vLLM 和 MLX,并获得了 ISO42001负责任 AI 开发的认证。
Granite4.0Nano 家族包括四款模型:Granite-4.0-H-1B(约1.5亿参数)、Granite-4.0-H-350M(约350万参数)、Granite-4.0-1B(接近2亿参数的变种)和 Granite-4.0-350M(变种)。其中,H 系列模型采用混合状态空间架构,适用于低延迟的边缘环境,而标准的变压器模型则提供了更广泛的兼容性。
尽管市场上已有许多小型语言模型,但 IBM 的 Nano 家族凭借卓越的性能脱颖而出。最新的基准测试显示,Granite4.0模型在多个领域的表现优于同类竞争对手。IBM 的研究团队表示,这些模型在指令跟随和功能调用任务中表现突出,并且在内存需求和运行速度上具有优势,能够在移动设备或 CPU 上流畅运行。
值得一提的是,IBM 不仅发布了这些模型,还积极与开发者社区进行互动,收集反馈并讨论未来的开发计划。Granite 团队在 Reddit 平台上与用户进行交流,展现了公司在推动开放源代码 AI 发展方面的努力。
huggingface:https://huggingface.co/blog/ibm-granite/granite-4-nano
划重点:
🌟 IBM 发布了 Granite4.0Nano 模型,支持在普通硬件上运行,提升了小型 AI 模型的可用性。
🛠️ 所有模型均在 Apache2.0许可下发布,适合研究和商业用途,确保了开放性和兼容性。
📈 最新基准测试显示,Granite4.0模型在性能上超越同类产品,展现了高效的处理能力。
这是一篇关于IBM 发布 Granite 4.0 Nano 模型,突破小型 AI 模型的性能极限的文章,内容值得关注。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
