首页 > 快讯 > 全新AI推理服务器由红帽推出，促进混合云环境的智能进化

全新AI推理服务器由红帽推出，促进混合云环境的智能进化

发布时间：2025-05-22 15:47:11 | 责任编辑：张毅 | 浏览量：73 次

红帽公司近期正式推出了红帽 AI 推理服务器（Red Hat AI Inference Server），这款服务器旨在为混合云环境提供更加高效和经济的 AI 推理服务。通过采用先进的 vLLM 技术，并结合 Neural Magic 的创新能力，红帽希望为用户带来更快的响应速度和更优越的性能。
红帽 AI 推理服务器是一款专为高性能设计的开放推理解决方案，配备了一系列先进的模型压缩与优化工具。它的设计理念是将 vLLM 的前沿创新与红帽的企业级能力相结合，以便为用户提供灵活的部署选项。用户可以选择将其作为独立的容器化产品使用，或者将其与红帽企业 Linux（RHEL AI）和红帽 OpenShift AI 集成。
在各种部署环境中，红帽 AI 推理服务器能够向用户提供经过加固的 vLLM 发行版。其主要功能包括智能 LLM 压缩工具，可以显著缩减基础 AI 模型与微调 AI 模型的大小，同时在保持模型准确性的前提下，尽量降低计算资源的消耗。此外，红帽还提供了一个优化的模型存储库，该存储库托管在红帽 AI 组织的 Hugging Face 中，用户可以即时访问经过验证的 AI 模型。这些模型经过优化后，能够在推理部署中提升效率，效率提升可达到2到4倍，并且不会影响模型的准确性。
红帽为用户提供了强大的企业支持，这种支持基于公司多年来在将社区项目推向生产环境方面的丰富经验。与此同时，红帽 AI 推理服务器还支持在非红帽 Linux 和 Kubernetes 平台上的灵活部署，帮助用户在选择部署环境时获得更大的选择空间。
红帽 AI 业务部门副总裁 Joe Fernandes 表示:“推理是生成式 AI 的核心价值所在，它使得模型在用户互动时能够快速给出准确的回复。我们的目标是以高效和经济的方式满足大规模的推理需求。” 红帽 AI 推理服务器的推出，将为用户提供一个通用的推理层，支持在各种环境中运行不同模型的加速。
划重点:
🚀 红帽 AI 推理服务器结合 vLLM 和 Neural Magic 技术，为混合云环境提供高效推理服务。
📉 具备智能 LLM 压缩工具和优化模型存储库，能有效提升推理效率2-4倍。
🛠️ 提供企业级支持与灵活部署选项，适应多种操作系统与平台。

2025年5月19日，红帽公司宣布推出红帽AI推理服务器（Red Hat AI Inference Server），这是其在混合云中普及生成式AI（Gen AI）的重要一步。

产品特点

技术驱动：该服务器由vLLM驱动，并通过红帽对Neural Magic技术的集成进一步增强。它采用了深度学习中的神经网络优化算法，结合高性能推理引擎，能够在任意云环境中高效运行各种生成式AI模型。
性能优势：据官方数据，红帽AI推理服务器在多个主流生成式模型（如GPT系列、LLaMA等）中，推理速度提升达30%以上。
模型优化：配备先进的模型压缩和优化工具，可大幅缩减基础AI模型与微调AI模型大小，在保持甚至可能进一步提升模型准确性的同时，最小化计算资源消耗。
部署灵活性：可以作为独立的容器化产品交付，也可以作为红帽企业Linux AI（RHEL AI）和红帽OpenShift AI的一部分提供。此外，还支持在非红帽Linux和Kubernetes平台上部署。
企业级支持：提供红帽的企业支持，以及在将社区项目带入生产环境方面数十年的专业经验。

产品意义

解决行业痛点：随着生成式AI模型复杂性激增及生产部署规模扩大，推理可能成为关键瓶颈，消耗大量硬件资源，削弱响应能力，并抬高运营成本。红帽AI推理服务器的推出，直接解决了这些挑战。
推动行业标准：红帽致力于构建一个繁荣的生态系统，围绕vLLM社区，推动其成为新型跨混合云环境推理的开放标准权威。
助力企业转型：该服务器赋能企业，在生产环境中高效部署和扩展生成式AI，从而实现更快速、更高效地运行生成式AI应用。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。