首页 > 快讯 > Moonshot AI 和清华大学联合推出 PrfaaS 架构：数据中心间的技术革新

Moonshot AI 和清华大学联合推出 PrfaaS 架构：数据中心间的技术革新

发布时间：2026-04-20 10:15:47 | 责任编辑：吴昊 | 浏览量：3 次

随着大型语言模型（LLM）在推理过程中对计算资源的需求不断增加，传统的服务架构面临瓶颈。Moonshot AI 与清华大学的研究团队最近推出了一种新架构 —— 预填充即服务（PrfaaS），旨在打破大型语言模型服务中对数据中心和计算机资源的限制。
目前，大型语言模型的推理过程通常分为预填充和解码两个阶段。预填充阶段是模型处理输入并生成键值缓存（KVCache）的高计算密集型过程，而解码阶段则是模型逐个生成输出的内存带宽密集型过程。传统架构需要在同一数据中心中完成这两个阶段，这在计算和带宽上造成了限制。
PrfaaS 通过将预填充任务卸载到专用的高计算集群上，并利用通用以太网将生成的 KVCache 传输到本地解码集群，从而实现了跨数据中心的高效服务。研究表明，该架构在处理性能上显著提升，相比于传统模型，服务吞吐量提高了 54%。在实际案例研究中，该架构还表现出更低的延迟和更高的效率。
PrfaaS 架构的设计将计算、网络和存储三大子系统分开管理，通过精确的路由机制确保长请求能高效传输，避免了传统方法中因资源分配不均而导致的拥堵问题。同时，该系统还引入了双时间尺度调度机制，以应对不同流量模式的变化，进一步优化资源利用。
随着对跨数据中心推理需求的增加和新型硬件的不断涌现，PrfaaS 无疑为未来的 AI 应用提供了新的解决方案。

这是一篇关于跨数据中心的创新：Moonshot AI 与清华大学提出 PrfaaS 架构的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：杨立昆对Anthropic CEO猛烈抨击：别被那个卖东西的给忽悠了

下一篇： Nature 发布重磅研究：AI 中的数字暗藏不良特征，蒸馏模型安全防线面临崩溃，潜意识也能“隔空传播风险”！

Moonshot AI 和清华大学联合推出 PrfaaS 架构：数据中心间的技术革新

最新Ai信息

最新Ai工具

热门AI推荐