首页 > 快讯 > 阶跃星辰发布全新多模态推理模型——Step-R1-V-Mini

阶跃星辰发布全新多模态推理模型——Step-R1-V-Mini

发布时间:2025-04-09 09:10:55 | 责任编辑:字母汇 | 浏览量:22 次

阶跃星辰科技团队宣布正式推出全新的多模态推理模型 Step-R1-V-Mini。这一模型的发布标志着在多模态协同推理领域的新突破,为AI技术的进一步发展注入了新的活力。Step-R1-V-Mini支持图文输入和文字输出,具备良好的指令遵循能力和通用性,能够高精度感知图像并完成复杂的推理任务。
Step-R1-V-Mini的训练方法在技术上进行了创新,采用了多模态联合强化学习,基于PPO(Proximal Policy Optimization)强化学习策略,在图像空间引入了verifiable reward机制。这一机制有效解决了图片空间推理链路复杂、容易产生混淆的相关和因果推理错误的问题。与DPO(Direct Preference Optimization)等方法相比,Step-R1-V-Mini在处理图像空间的复杂链路时更具泛化性和鲁棒性。
此外,为了充分利用多模态合成数据,阶跃星辰设计了大量基于环境反馈的多模态数据合成链路,合成了可规模化训练的多模态推理数据。通过基于PPO的强化学习训练,同步提升了模型的文本和视觉推理能力,有效避免了训练过程中的跷跷板问题。
在视觉推理领域的表现上,Step-R1-V-Mini取得了显著的成绩。在多个公开榜单中,Step-R1-V-Mini均表现亮眼,特别是在MathVision视觉推理榜单上位列国内第一。这表明该模型在视觉推理、数学逻辑和代码等方面具有优异的表现。
Step-R1-V-Mini的实际应用案例也展示了其强大的功能。例如,在“看图识地点”案例中,输入网友拍摄的温布利球场图片,Step-R1-V-Mini能够迅速识别图中元素,结合不同元素如颜色、物体(体育场、曼城队徽)等进行综合判断,准确推断出地点为温布利体育场,并给出了可能的对战双方。在“看图识菜谱”案例中,输入一张美食图,Step-R1-V-Mini能够精准识别菜品和蘸料,并详细列出具体用量,如“鲜虾300g、大葱白2根”等。在“物体数量计算”案例中,输入一张含有不同形状、颜色和位置的物体摆放图,Step-R1-V-Mini能够逐一识别,根据物体的颜色、形状和位置进行推理计算,最终得出剩下的物体数量。
Step-R1-V-Mini的发布为多模态推理领域带来了新的希望。该模型已正式上线阶跃AI网页端,并在阶跃星辰开放平台提供API接口,供开发者和研究人员体验和使用。阶跃星辰表示,Step-R1-V-Mini是他们在多模态推理方向的阶段性成果,未来将继续在推理模型方向进行探索,以推动AI技术的进一步发展。
阶跃AI 网页端:
https://yuewen.cn/chats/new
阶跃星辰开放平台:
https://platform.stepfun.com/docs/llm/reasoning

阶跃星辰发布全新多模态推理模型——Step-R1-V-Mini

2025年4月8日,阶跃星辰正式发布了全新的多模态推理模型——Step-R1-V-Mini。以下是该模型的主要特点和相关信息:

模型特点

  • 多模态输入与输出:支持图文输入和文字输出,能够处理多种类型的数据。
  • 高精度图像感知:具备高精度的图像感知能力,可以准确地识别和处理图像信息。
  • 复杂推理任务:能够完成复杂的推理任务,展现出强大的逻辑分析和问题解决能力。
  • 良好的指令遵循和通用能力:对用户指令有良好的遵循性,并且在多种应用场景中表现出广泛的通用性。

应用场景

  • 数据分析:通过图像输入获取直观信息,以简洁的文字输出分析结果,极大提升工作效率。
  • 图像处理:在图像识别、分析和处理领域,能够提供更精准的结果。
  • 多领域应用:适用于教育、医疗、金融、电商等多个领域,具有广阔的应用前景。

使用方式

  • 网页端体验:Step-R1-V-Mini已正式上线阶跃AI网页端,用户可以直接在网页上体验其功能。
  • API接口:在阶跃星辰开放平台提供API接口,允许开发者将该模型集成到各自的应用程序中。

发布意义

Step-R1-V-Mini的发布,标志着阶跃星辰在多模态AI领域迈出了重要一步,为未来AI应用的发展提供了新的可能性。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具