首页 > 快讯 > 蚂蚁集团推出Ming-lite-omni:首例与GPT-4o相媲美的开源多模态模型

蚂蚁集团推出Ming-lite-omni:首例与GPT-4o相媲美的开源多模态模型

发布时间:2025-05-29 15:25:09 | 责任编辑:吴昊 | 浏览量:14 次

蚂蚁集团旗下百灵大模型团队在近期蚂蚁技术日上宣布重大决定:将统一多模态大模型Ming-lite-omni进行全面开源。这一举措不仅标志着蚂蚁集团在AI领域的又一次重大开放,更被业界视为首个在模态支持方面能够与GPT-4o相媲美的开源模型。


Ming-lite-omni基于Ling-lite构建,采用先进的MoE(专家混合)架构,拥有220亿总参数和30亿激活参数的强大配置。这一参数规模在开源多模态模型中达到了新的高度,展现了蚂蚁集团在大模型技术上的深度积累。
目前,Ming-lite-omni的模型权重和推理代码已向公众全面开放,后续的训练代码和训练数据也将陆续发布,为全球开发者提供完整的技术支持。
今年以来,百灵大模型团队已连续开源多个重要模型产品,包括Ling-lite、Ling-plus等大语言模型,多模态大模型Ming-lite-uni以及预览版Ming-lite-omni。
其中,五月中旬开源的Ling-lite-1.5版本能力已接近同水位SOTA水平,性能介于千问4B和8B之间,成功验证了300B尺寸SOTA MoE大语言模型在非高端算力平台上训练的可行性。
在多项理解和生成能力评测中,Ming-lite-omni的性能与10B量级领先的多模态大模型相当或更优。蚂蚁集团表示,这是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型,为全球开发者提供了重要的技术选择和参考标准。
百灵大模型负责人西亭介绍了团队的技术路线:"我们坚定地在语言大模型和多模态大模型上统一使用MoE架构,并大量使用非高端算力平台,成功证明了国产GPU在训练可比拟GPT-4o模型方面的能力。"

蚂蚁集团推出Ming-lite-omni:首例与GPT-4o相媲美的开源多模态模型-项目/模型网址:
Model Scope Hugging Face
蚂蚁集团推出Ming-lite-omni:首例与GPT-4o相媲美的开源多模态模型

蚂蚁集团于2025年5月27日在杭州举办的蚂蚁技术开放日上宣布开源其统一多模态大模型 Ming-lite-omni。该模型是基于 Ling-lite 构建的 MoE(混合专家)架构 的全模态模型,拥有 220亿总参数30亿激活参数。其主要特点包括:

技术特点

  • 理解与生成一体化:首次将理解和生成模型整合到同一框架内,用户可以将两者合在一起调用,也可以单独完成理解和生成任务。
  • 全模态输入输出:支持音频、视频、图像和文本等多种输入和输出形式,真正实现了全模态交互。
  • 高效的MoE架构:采用混合专家架构,优化了模型的性能,提升了交互的灵活性。

性能表现

在多项理解和生成能力评测中,Ming-lite-omni的性能与 10B量级领先的多模态大模型相当或更优。蚂蚁集团认为,这是目前已知首个在模态支持方面能够与 GPT-4o 相媲美的开源模型。

开源意义

  • 推动技术普惠:通过开源,蚂蚁集团希望推动全模态AI的普惠化,让更多开发者和研究者能够使用和改进这一技术。
  • 验证国产算力:该模型在非高端算力平台上训练,验证了国产GPU在训练类似GPT-4o模型方面的能力。

未来规划

蚂蚁集团计划持续优化Ming-lite-omni在全模态理解和生成任务上的效果,并提升其多模复杂推理能力。同时,他们还将训练更大尺寸的全模态模型 Ming-plus-omni

目前,Ming-lite-omni的模型权重和推理代码已经开源,后续的训练代码和训练数据也将陆续发布。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复