首页 > 快讯 > 蚂蚁数科推出多语言视觉大模型训练系统,消除语言障碍!

蚂蚁数科推出多语言视觉大模型训练系统,消除语言障碍!

发布时间:2025-11-04 18:07:35 | 责任编辑:张毅 | 浏览量:9 次

在香港金融科技节上,蚂蚁数科推出了一项革命性的技术 ——“多语种多模态大模型训练框架”,旨在突破当前大模型在多语言环境中应用的瓶颈。该框架特别针对资源稀缺的小语种,如埃及阿拉伯语、印尼爪哇语、巴哈萨语和巽他语,显示出了非凡的潜力。
这一创新技术的核心在于其独特的语言感知优化框架。该框架采用了 “以目标语言进行思考” 的机制,结合细粒度、多维度的奖励策略和自动化数据解决方案,极大地增强了对小语种的理解与处理能力。根据测试结果,蚂蚁数科的新框架在主流的多语言视觉问答(Multilingual Visual Question Answering,VQA)基准测试中,准确率较同规模的开源模型提升了约 9.5%。甚至在某些任务中,框架的表现还超过了 GPT-4o 和 Gemini-2.5-flash 等国际主流闭源模型,荣获评测总分第一。
除了语言模型的突破,蚂蚁数科还推出了图像安全框架,这一技术结合了视觉分析与常识推理,能够高效识别图像中的伪造与不一致性。新框架不仅能够精确定位篡改区域,还提供可解释的分析,显著提升了数字内容的风险控制能力。这一技术的成功实施将为各种场景下的数字内容保护提供更有力的支持。
作为蚂蚁数科全球业务的核心技术,这两项能力已经在 ZOLOZ 的文档识别鉴真产品(RealDoc)中得到了广泛应用,支持 119 种语言,能够高效处理多种商务文档、合同和证件,覆盖保险理赔、信贷审核及跨境贸易等多个领域。这不仅展示了蚂蚁数科在多语言处理领域的领先地位,也为全球用户提供了更好的服务体验。

蚂蚁数科推出多语言视觉大模型训练系统,消除语言障碍!

这是一篇关于蚂蚁数科发布多语种视觉大模型训练框架,打破语言壁垒!的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐