首页 > 快讯 > 全新基础模型Step 3由阶跃星辰推出,配置高达321B参数

全新基础模型Step 3由阶跃星辰推出,配置高达321B参数

发布时间:2025-07-29 11:32:15 | 责任编辑:张毅 | 浏览量:7 次

在2025世界人工智能大会(WAIC2025)前夕,阶跃星辰在上海发布了其新一代基础大模型 ——Step3。这款模型不仅在智能性上取得突破,还兼顾了推理效率,旨在为企业和开发者提供最优质的应用方案。Step3计划于7月31日正式开源,标志着阶跃星辰为全球开源社区贡献出一款强大的多模态推理模型。
为了推动大模型的应用落地,阶跃星辰还联合多家国内领先的芯片和平台厂商,成立了 “模芯生态创新联盟”。这一联盟的目标是通过模型与芯片产业链的创新合作,加速大模型在各个行业的应用。此外,阶跃星辰还与上海国有资本投资有限公司达成战略合作,旨在加强资本和生态业务的协作。
阶跃星辰创始人兼 CEO 姜大昕表示,从 Step1到 Step2的快速迭代,使得团队在思考最适合应用的模型时,更加关注客户的真实需求。新一代 Step3模型被定义为推理时代的最佳应用模型,它具备强智能、低成本、可开源和多模态等特征,四个维度缺一不可。
Step3是阶跃星辰首个全尺寸的原生多模态推理模型,参数量高达321B,其中激活参数量为38B。它在视觉感知和复杂推理方面表现出色,能够处理跨领域的知识理解和视觉信息分析。例如,它能够准确读取反光菜单的内容,甚至在微信聊天记录中自动计算消费分摊的费用。Step3在多个榜单上取得了开源多模态推理模型的 SOTA 成绩。
为了提升模型的推理效率,阶跃星辰在架构设计上进行了创新,使得 Step3在不同硬件平台上的推理表现出色。根据测试,Step3在国产芯片上的推理效率最高可达 DeepSeek-R1的300%,且在与 NVIDIA Hopper 架构芯片的分布式推理中,吞吐量提升超过70%。
阶跃星辰建立了 “1+N” 的模型矩阵,其中 “1” 指的是 Step3,而 “N” 则是多个多模态模型,覆盖语音、视觉理解和图像生成等领域。通过与近10家芯片及基础设施厂商的合作,阶跃星辰致力于提升大模型的适配性和算力效率,从而推动应用的落地。
划重点:
🌟 新一代基础大模型 Step3将在7月31日开源,标志着多模态推理模型的重大进步。
🤝 阶跃星辰与多家芯片和平台厂商联合成立 “模芯生态创新联盟”,加速大模型应用落地。
📈 Step3在推理效率方面表现出色,能够在多种硬件平台上实现高效运行。

全新基础模型Step 3由阶跃星辰推出,配置高达321B参数

阶跃星辰于 2025 年 7 月 25 日在上海发布了新一代基础大模型 Step 3,这是其首个全尺寸、原生多模态推理模型,采用 MoE 架构,总参数量 321B,激活参数量 38B,兼顾模型效果与推理成本。Step 3 具备强大的视觉感知和复杂推理能力,在 MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench 等多个榜单上取得了开源多模态推理模型的 SOTA 成绩。此外,Step 3 通过架构和系统创新,在国产芯片上的推理效率最高可达 DeepSeek-R1 的 300%,在基于 NVIDIA Hopper 架构的芯片上分布式推理时,吞吐量提升超 70%。Step 3 将于 7 月 31 日面向全球企业和开发者开源,华为昇腾芯片已率先实现搭载,沐曦、天数智芯等也初步实现运行。同时,阶跃星辰联合近 10 家芯片及基础设施厂商组建了“模芯生态创新联盟”,以推动模型和芯片产业链的联合创新。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具