首页 > 快讯 > 新版MiniCPM-V 4.0视觉模型在手机上实现更加流畅的体验

新版MiniCPM-V 4.0视觉模型在手机上实现更加流畅的体验

发布时间：2025-08-11 11:58:25 | 责任编辑：张毅 | 浏览量：295 次

在人工智能的持续发展中，最近一款新模型 MiniCPM-V4.0引起了广泛关注。该模型是 MiniCPM-V 系列的最新版本，具有4.1亿参数，基于 SigLIP2-400M 和 MiniCPM4-3B 进行构建。与之前的版本相比，MiniCPM-V4.0在单图、多图及视频理解方面表现出色，并且在效率上有了显著提升。
MiniCPM-V4.0以其强大的视觉能力而自豪。在众多评测基准中，该模型在 OpenCompass 的综合评估中取得了69.0的平均分，超越了 GPT-4.1-mini-20250414、MiniCPM-V2.6（8.1亿参数，得分65.2）和 Qwen2.5-VL-3B-Instruct(3.8亿参数，得分64.5)。在多图理解和视频理解领域，它也展现了良好的性能。
针对移动设备的设计是 MiniCPM-V4.0的一大亮点。该模型在 iPhone16Pro Max 上运行顺畅，首次响应延迟不到2秒，解码速度超过每秒17个 token，且没有发热问题。即便在高并发请求下，它也表现出优越的吞吐能力。
为了让更多用户轻松上手，MiniCPM-V4.0提供了多种使用方式，包括与多种平台兼容的工具，如 llama.cpp、Ollama、vLLM 等。为了更好地服务用户，开发团队还开源了一款可以在 iPhone 和 iPad 上运行的 iOS 应用，帮助用户轻松上手。配套的 Cookbook 也提供了详细的使用指南和实用示例，进一步简化了操作过程。
项目:https://huggingface.co/openbmb/MiniCPM-V-4
划重点:
🌟 MiniCPM-V4.0在 OpenCompass 评测中得分69.0，超越多款同类模型。
📱 该模型专为移动设备设计，响应快且无发热问题。
📚 开源 iOS 应用及详细使用指南，让用户更轻松上手。

MiniCPM-V 4.0（小钢炮4.0视觉模型）是OpenBMB团队发布的最新多模态模型，专为手机等端侧设备优化，具有4.1B参数，基于SigLIP2-400M和MiniCPM4-3B构建。在OpenCompass等权威评测中，其平均得分达69.0，超越了GPT-4.1-mini、MiniCPM-V 2.6（8.1B参数）和Qwen2.5-VL-3B-Instruct等模型。该模型在iPhone 16 Pro Max等设备上运行流畅，首次响应延迟不到2秒，解码速度超过17 tokens/s，无发热问题，适合高并发场景。此外，MiniCPM-V 4.0支持多种部署方式（如llama.cpp、Ollama、vLLM等），并配开源iOS应用及详细使用指南（Cookbook），便于用户快速上手。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：每日享受2000次免费的通义千问 Qwen Code 调用，比 Gemini 更显慷慨

下一篇： “马斯克的新产品引发热议：’辣味模式’在Grok Imagine视频工具中引发公关风波”

新版MiniCPM-V 4.0视觉模型在手机上实现更加流畅的体验

最新Ai信息

最新Ai工具

热门AI推荐