即将部署的全球首台 1GW+ 能耗超级计算机集群由 Meta 打造,标志着 AI 算力竞争迈入新阶段
发布时间:2025-07-15 12:44:46 | 责任编辑:张毅 | 浏览量:12 次
Meta 首席执行官马克·扎克伯格通过社交媒体宣布,公司正加速推进人工智能基础设施建设,计划上线全球首个功耗超过1吉瓦(GW)的超级计算机集群“Prometheus”,预计于2026年投入使用。同时,Meta 正在规划另一个名为“Hyperion”的超大规模集群,未来几年内功耗将达到5GW,规模堪比曼哈顿。
Meta 的“Prometheus”超级计算机集群被定位为全球首个功耗超过1吉瓦的 AI 算力基础设施。据社交媒体讨论,这一集群将搭载约130万块 NVIDIA H100GPU,预计提供超过2艾克萨(exaflops)的混合精度算力,远超 Meta 此前于2022年推出的 AI Research SuperCluster(RSC,约5exaflops)。Prometheus 专为训练下一代大语言模型(如 Llama4)及通用人工智能(AGI)设计,目标是支持多模态 AI 任务,包括实时语音翻译、增强现实(AR)应用及元宇宙相关技术。
与传统超级计算机不同,Prometheus 采用 NVIDIA Quantum2InfiniBand 网络架构和 Grand Teton 硬件平台(Meta 贡献给开放计算项目 OCP 的设计),优化了 GPU 间的通信效率和数据中心能效。社交媒体上,开发者对 Prometheus 的规模表示震撼,称其“重新定义了 AI 算力的上限”。
除了 Prometheus,Meta 还透露正在规划“Hyperion”集群,预计功耗高达5GW,规模堪比一座小型城市。这一集群将进一步扩展 Meta 的 AI 基础设施,目标是支持更复杂的模型训练和推理任务。社交媒体上,有分析指出,Hyperion 的能耗相当于老马(xAI)30万张 GPU 集群的20倍,显示出 Meta 在算力投资上的激进策略。
Hyperion 的具体细节尚未完全公开,但 Meta 表示,该集群将采用液冷技术和高性能网络架构,以应对大规模 AI 训练的散热和通信需求。此外,Meta 计划在2025年投资600-650亿美元用于数据中心建设和 AI 团队扩张,以确保算力与人才储备的同步增长。
Meta 的1GW+集群计划正值全球 AI 算力竞赛进入白热化阶段。2022年,Meta 推出 RSC 时,其16,000块 NVIDIA A100GPU 已使其跻身全球最快的 AI 超级计算机之一。如今,Prometheus 和 Hyperion 的规划进一步提升了 Meta 在 AI 基础设施领域的地位,直接挑战 OpenAI、xAI、谷歌及微软等竞争对手。
社交媒体反馈显示,业内人士对 Meta 的战略褒贬不一。支持者认为,1GW+集群将为 Meta 的 Llama 系列模型和元宇宙生态提供强大支持,可能推动开源 AI 生态的进一步发展;批评者则担忧如此高能耗的算力基础设施可能加剧能源消耗和环境压力。
与此同时,Meta 的竞争对手也在加码算力投资。例如,xAI 近期宣布其 Memphis 超级计算机集群(约30万块 GPU)功耗在200-300兆瓦,而微软与 OpenAI 合作的 Stargate 项目计划投资超5000亿美元建设 AI 数据中心。Meta 的1GW+集群无疑是对这些项目的直接回应。
Meta 强调,Prometheus 和 Hyperion 将延续其在开放计算(Open Compute Project)和 PyTorch 等开源生态中的承诺。集群设计基于 Grand Teton 平台,支持 RoCE 和 InfiniBand 两种网络架构,展示了 Meta 在硬件灵活性和可扩展性上的探索。此外,Meta 承诺在数据隐私方面采取严格措施,集群将与互联网隔离,数据传输全程加密,以保护用户数据安全。
社交媒体上,开发者对 Meta 的开源策略表示欢迎,认为这将进一步降低 AI 开发门槛。然而,也有用户指出,如此大规模的算力部署可能需要更透明的能源使用和碳排放报告,以回应公众对可持续性的关注。
从 小编 的视角来看,Meta 的1GW+超级计算机集群计划不仅是技术上的突破,也是其在 AI 和元宇宙领域战略布局的关键一步。Prometheus 和 Hyperion 的上线将显著提升 Meta 在大模型训练和多模态 AI 应用上的竞争力,可能推动 Llama4成为2025年的领先开源模型。然而,高能耗带来的环境和运营成本压力,以及与 xAI、OpenAI 等对手的激烈竞争,将考验 Meta 的执行能力和资源整合能力。
此外,Meta 需平衡开源社区的期望与商业化目标,确保其算力投资能够转化为实际的产品创新和用户价值。小编 将持续关注 Meta 集群的建设进展及其对全球 AI 生态的影响。
欲体验 Meta 的 AI 技术,可访问 Meta AI 官网(https://ai.facebook.com)或关注其社交媒体更新。有关 Prometheus 和 Hyperion 的进一步信息,可参考 Meta 工程博客(https://engineering.fb.com)或 Open Compute Project 官网。
Meta 正在加速推进 AI 基础设施,计划上线全球首个功耗超过 1 吉瓦(GW)的超级计算机集群 Prometheus(预计 2026 年投入使用),并规划另一个名为 Hyperion 的集群,未来几年功耗将扩展到 5GW,规模堪比曼哈顿。Prometheus 将搭载约 130 万块 NVIDIA H100GPU,提供超过 2 艾克萨(exaflops)的混合精度算力,专为训练下一代大语言模型(如 Llama4)及支持多模态 AI 任务设计。
Meta 的这一举措旨在超越 OpenAI、xAI、谷歌及微软等竞争对手,直接回应了全球 AI 算力竞赛的白热化状态。此外,Meta 计划投资数千亿美元用于 AI 基础设施建设,并成立 Meta 超级智能实验室,目标是实现通用人工智能(AGI),其计算水平将为行业领先。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。