腾讯发布超轻量离线翻译开源模型,手机端运行只需0.4GB内存
发布时间:2026-04-30 10:52:16 | 责任编辑:张毅 | 浏览量:3 次
4月29日,腾讯混元团队宣布正式开源其极限量化压缩版的翻译模型——Hy-MT1.5-1.8B-1.25bit。这款模型最大的亮点在于,它将支持33种语言的翻译能力精准压缩到了440MB左右,这意味着即便是存储空间紧凑的移动设备,也能在完全不联网的状态下实现高质量的实时翻译。
这一成果源于腾讯此前发布的专业翻译大模型Hy-mt1.5。原始的1.8B模型在常规精度下需要占用约3.3GB的内存,这对于手机端运行而言无疑是沉重的负担。为了解决这一痛点,研发团队采用了极致的量化压缩技术,将参数表达由16位(16-bit)降至最低1.25位。
通俗来讲,这一过程类似于在不损失关键细节的前提下,将一张4K高清大图压缩成体积极小的微缩图。针对不同性能的设备,腾讯此次同步推出了2-bit和1.25-bit两种量化方案,确保模型在“瘦身”后依然能够保持卓越的语义理解能力。
虽然体积大幅缩小,但在性能表现上并未缩水。根据官方公布的评测数据,这款1.8B参数级的轻量模型在多个基准测试中,翻译质量已经能够比肩甚至超越谷歌翻译等主流商业系统,甚至在某些维度上可以与千亿级(235B)的大型模型抗衡。
目前,该模型已原生支持包括中、英、日、法、俄、阿拉伯语在内的33种语言,并涵盖了藏语、蒙古语等少数民族语言。此外,它还支持5种方言及民汉互译,总计翻译方向高达1056个,极大地拓宽了离线翻译的应用边界。
除了单纯的权重开源,该技术已在实际场景中展现出极高的实用价值。在最新适配的演示版本中,该模型支持“后台取词模式”,无论用户是在离线阅读邮件还是浏览本地网页,翻译功能都能即唤即用。
值得关注的是,由于翻译过程完全在本地设备运行,不涉及任何个人隐私信息的上传或云端采集,这为对数据安全有极高要求的用户提供了可靠保障。目前,该翻译能力已在腾讯内部的会议系统、办公软件及浏览器等多个核心业务场景中落地应用。
为了方便开发者和技术爱好者体验,相关模型已在Huggingface及魔搭社区同步上线。这标志着高精度翻译技术正加速从云端走向终端,让翻译服务真正成为随身携带、触手可及的基础工具。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
