IBM发布z17大型机:每日可处理4500亿次AI推理,性能提升50%
发布时间:2025-04-08 14:32:37 | 责任编辑:字母汇 | 浏览量:27 次
IBM周一发布了其大型计算机硬件的最新产品——IBM z17。这款完全加密的大型机由IBM Telum II处理器驱动,专为250多种AI用例而设计,包括AI代理和生成式AI应用场景。
虽然大型机可能被一些人视为过时技术,但据消息人士透露,当今71%的《财富》500强企业仍在使用它们。根据咨询公司Market Research Future的数据,到2024年,大型机市场价值估计将达到53亿美元。
z17每天能处理4500亿次推理运算,比2022年发布的前代产品IBM z16提升了50%。新系统设计理念是能够与其他硬件、软件和开源工具完全集成,提供灵活的企业计算解决方案。
IBM Z产品管理和设计副总裁蒂娜·塔奎尼奥(Tina Tarquinio)在接受TechCrunch采访时表示,这次大型机升级已经筹备了五年,远早于2022年11月OpenAI发布ChatGPT引发的当前AI热潮。IBM在打造z17时花费了2,000多个小时的研究时间,从100多个客户那里收集反馈。塔奎尼奥认为有趣的是,五年前开始的研发方向与市场最终的走向高度一致。
塔奎尼奥说:"当我们得知要推出AI加速器时,尤其是在2022年下半年,行业中关于AI的所有变化都令人兴奋不已。我认为最大的问题是,我们不知道接下来会发生什么。因此,就AI能帮助我们做什么而言,可能性真的是无限的。"
z17的设计考虑了AI市场的快速发展趋势。这款大型机在发布时将支持48个IBM Spyre AI加速器芯片,并计划在12个月内将这一数字提高到96个。"我们有意留有余地,提高人工智能的敏捷性,"塔奎尼奥解释道,"随着新模型的推出,我们确保为更大的模型留有空间——这些模型可能需要更多的本地内存来相互通信。我们之所以这样做,是因为我们知道这确实是会变化的领域。新模型会不断出现和发展。"
塔奎尼奥强调,z17的一大亮点是节能性能。"在片上,我们将AI加速提高了7.5倍,但所需的能耗比在业内其他类型的加速器或平台上进行多模型处理所需能耗少5.5倍。"
IBM z17大型机将于6月8日全面上市。

目前,在提供的搜索结果中,并未提及IBM发布“z17大型机”或相关性能指标的信息。不过,IBM近期确实在大型机AI计算领域有重要动作,主要集中在Telum II处理器和Spyre加速器的发布上,以下是相关要点:
1. IBM Telum II 处理器:AI推理性能大幅提升
- 计算能力:Telum II 处理器集成AI加速器,单个芯片可提供 24 TOPS(每秒24万亿次操作),每个处理器抽屉(含8个芯片)达 192 TOPS,全系统(4个抽屉)可达 768 TOPS。
- 性能优化:相比上一代Telum,计算能力提升 4倍,并支持 低延迟AI推理,适用于金融欺诈检测、实时交易分析等场景。
- 缓存与频率:采用 5nm工艺,8核5.5GHz,片上缓存 360MB(提升40%),支持更高效的数据处理。
2. IBM Spyre 加速器:增强AI模型训练与推理
- 内存容量:高达 1TB,支持 int4/int8/fp8/fp16 数据类型,适用于大语言模型(LLM)和生成式AI。
- 可扩展性:可与Telum II 协同工作,提供 AI集成建模(结合多种ML/DL模型),提升结果准确性。
3. 应用场景与行业影响
- 金融行业:增强 实时欺诈检测、反洗钱(AML)分析。
- 企业AI:支持 生成式AI助手、代码解释等高级应用。
4. 发布时间
- Telum II 和 Spyre 预计 2025年 随下一代IBM Z/LinuxONE系统推出。
虽然“z17”未被提及,但IBM的 Telum II + Spyre 组合已显著提升大型机的AI推理能力,未来或可支持更高规模的计算需求。如需“z17”的官方信息,建议关注IBM最新公告。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。