新版MiniCPM-V 4.0视觉模型在手机上实现更加流畅的体验
发布时间:2025-08-11 11:58:25 | 责任编辑:张毅 | 浏览量:8 次
在人工智能的持续发展中,最近一款新模型 MiniCPM-V4.0引起了广泛关注。该模型是 MiniCPM-V 系列的最新版本,具有4.1亿参数,基于 SigLIP2-400M 和 MiniCPM4-3B 进行构建。与之前的版本相比,MiniCPM-V4.0在单图、多图及视频理解方面表现出色,并且在效率上有了显著提升。
MiniCPM-V4.0以其强大的视觉能力而自豪。在众多评测基准中,该模型在 OpenCompass 的综合评估中取得了69.0的平均分,超越了 GPT-4.1-mini-20250414、MiniCPM-V2.6(8.1亿参数,得分65.2)和 Qwen2.5-VL-3B-Instruct(3.8亿参数,得分64.5)。在多图理解和视频理解领域,它也展现了良好的性能。
针对移动设备的设计是 MiniCPM-V4.0的一大亮点。该模型在 iPhone16Pro Max 上运行顺畅,首次响应延迟不到2秒,解码速度超过每秒17个 token,且没有发热问题。即便在高并发请求下,它也表现出优越的吞吐能力。
为了让更多用户轻松上手,MiniCPM-V4.0提供了多种使用方式,包括与多种平台兼容的工具,如 llama.cpp、Ollama、vLLM 等。为了更好地服务用户,开发团队还开源了一款可以在 iPhone 和 iPad 上运行的 iOS 应用,帮助用户轻松上手。配套的 Cookbook 也提供了详细的使用指南和实用示例,进一步简化了操作过程。
项目:https://huggingface.co/openbmb/MiniCPM-V-4
划重点:
🌟 MiniCPM-V4.0在 OpenCompass 评测中得分69.0,超越多款同类模型。
📱 该模型专为移动设备设计,响应快且无发热问题。
📚 开源 iOS 应用及详细使用指南,让用户更轻松上手。
MiniCPM-V 4.0(小钢炮4.0视觉模型)是OpenBMB团队发布的最新多模态模型,专为手机等端侧设备优化,具有4.1B参数,基于SigLIP2-400M和MiniCPM4-3B构建。在OpenCompass等权威评测中,其平均得分达69.0,超越了GPT-4.1-mini、MiniCPM-V 2.6(8.1B参数)和Qwen2.5-VL-3B-Instruct等模型。该模型在iPhone 16 Pro Max等设备上运行流畅,首次响应延迟不到2秒,解码速度超过17 tokens/s,无发热问题,适合高并发场景。此外,MiniCPM-V 4.0支持多种部署方式(如llama.cpp、Ollama、vLLM等),并配开源iOS应用及详细使用指南(Cookbook),便于用户快速上手。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。