首页 > 快讯 > MiniCPM-V 4.5开源多模态模型发布,搭载8亿参数助力AI在移动设备上的应用

MiniCPM-V 4.5开源多模态模型发布,搭载8亿参数助力AI在移动设备上的应用

发布时间:2025-09-01 17:20:42 | 责任编辑:张毅 | 浏览量:10 次

近日,开源AI社区迎来重要进展,面向端侧设备的多模态大语言模型MiniCPM-V4.5正式发布。这款模型以8亿参数规模实现了在智能手机和平板电脑上的高效运行,为移动端AI应用开拓了新的可能性。
MiniCPM-V4.5采用轻量化设计思路,专为端侧设备优化。根据开发团队公布的测试数据,该模型在OpenCompass综合评估中获得77.2分的成绩,在同类开源模型中表现突出。模型支持单图理解、多图推理和视频分析等多种任务。
在移动设备部署方面,MiniCPM-V4.5在iPhone16Pro Max上的首token延迟约为2秒,解码速度超过每秒17个token。模型通过3D-Resampler技术将视频数据压缩率提升至96%,能够以64个token处理6帧视频内容,实现最高10FPS的实时视频理解。
光学字符识别是该模型的重点优化方向之一。基于LLaVA-UHD架构,模型支持高达180万像素的高分辨率图像处理,在OCRBench测试中准确率达到85.7%。此外,模型支持包括英语、中文、德语、法语在内的30多种语言。
MiniCPM-V4.5引入了可控混合思维机制,用户可通过参数设置在快速响应模式和深度推理模式间切换。快速模式适用于常规问答任务,深度模式则通过逐步推理处理复杂问题。
模型基于RLAIF-V和VisCPM技术进行训练,在减少幻觉现象方面有所改进。开发团队表示,这种训练方法提升了模型响应的准确性和可靠性。
MiniCPM-V4.5采用Apache-2.0许可证发布,支持学术研究免费使用,商业应用需要简单注册程序。模型兼容多种推理框架,包括llama.cpp、Ollama、vLLM和SGLang,并提供16种量化格式以适应不同硬件配置。
开发团队还发布了适配iOS的应用程序,方便用户在苹果设备上体验。开发者可通过Hugging Face和GitHub获取模型代码和文档,支持通过Gradio搭建本地Web界面,也可在NVIDIA GPU上进行推理加速。
作为专为移动端优化的多模态模型,MiniCPM-V4.5在隐私敏感和离线使用场景中具有应用价值。模型的轻量化设计降低了AI能力的部署门槛,为个人用户和开发者提供了新的选择。
需要注意的是,受参数规模限制,该模型在处理极其复杂任务时可能存在性能边界。用户在实际应用中应根据具体需求选择合适的模型方案。开发团队提醒,模型生成内容基于训练数据,用户需确保使用合规并承担相应责任。
MiniCPM-V4.5的发布体现了开源AI社区在端侧部署方向的技术探索。随着移动设备计算能力的持续提升,这类轻量化多模态模型可能为AI应用的普及化提供新的技术路径。
该项目的开源特性也为研究人员和开发者提供了学习和改进的基础,有望推动端侧AI技术的进一步发展。
项目地址:https://github.com/OpenBMB/MiniCPM-V

MiniCPM-V 4.5开源多模态模型发布,搭载8亿参数助力AI在移动设备上的应用
开源多模态模型 MiniCPM-V 4.5 于 2025 年 8 月 26 日发布,由清华大学自然语言处理实验室(THUNLP)与 ModelBest 团队联合推出,基于 Qwen3-8B 与 SigLIP2-400M 构建,总参数量为 8B,专为移动端部署优化,支持 iPhone、iPad 等端侧设备运行

。该模型在 OpenCompass 评测中平均得分 77.0,超越 GPT-4o-latest(75.3)、Gemini 2.0 Pro(74.8)和 Qwen2.5-VL 72B,成为开源社区中性能最强的端侧多模态模型

MiniCPM-V 4.5 引入多项创新,包括:

  • 高效视频理解:通过“3D 重采样器”模块实现 96 倍视频 token 压缩,支持高刷新率视频(最高 10 FPS)和长视频理解

  • 可控推理模式:提供“快速思考”和“深度思考”模式,可根据需求调节推理深度

  • 优化部署:支持 int4/AWQ 量化,可在手机等设备上流畅运行,官方已开源 iOS 应用

此外,MiniCPM-V 4.5 具备出色的 OCR 与复杂表格/文档解析能力,多语言支持,可靠性高,适用于多种端侧应用场景

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐