首页 > 快讯 > PaddleOCR 3.1版由百度AI团队发布 引入关键MCP功能支持

PaddleOCR 3.1版由百度AI团队发布 引入关键MCP功能支持

发布时间:2025-07-08 09:17:01 | 责任编辑:张毅 | 浏览量:17 次

7月7日,百度AI团队宣布PaddleOCR3.1版本正式上线,在多语种识别、复杂文档翻译及大模型连接能力上实现三大升级。新版本支持37种语言的文本识别,平均精度提升超30%,并推出文档翻译产线与MCP服务器功能,助力开发者高效构建AI应用。


针对全球化场景下的多语言需求,PaddleOCR3.1新增PP-OCRv5多语种模型,覆盖法语、西班牙语、俄语等37种语言。通过融合文心4.5多模态大模型的视觉与文本理解能力,模型可自动完成高置信度文本检测与数据标注,解决多语种数据稀缺痛点。实测数据显示,新模型在拉丁语系及东斯拉夫语言场景中的识别准确率提升超30%,例如韩文识别错误率从8.7%降至2.1%,俄文复杂排版文档的解析速度提升2倍。
结合PP-StructureV3文档解析引擎与文心大模型,PaddleOCR3.1推出PP-DocTranslation翻译产线。该工具可智能识别PDF、图片中的表格、公式、手写文字等复杂元素,并转换为Markdown格式后进行多语言翻译。针对法律、医疗等专业领域,系统支持用户上传术语对照表,实现“关键词汇”的精细化翻译。例如,某跨国药企使用该功能后,药品说明书翻译效率提升40%,专业术语一致性达99.2%。
为降低AI应用开发门槛,PaddleOCR3.1推出MCP(Model Context Protocol)服务器功能,支持通过标准化协议将OCR能力无缝接入下游应用。开发者仅需几步即可搭建MCP服务,通过本地Python库、飞桨星河社区或自托管服务调用核心功能,包括图像文字识别、文档版面分析等。

PaddleOCR 3.1版由百度AI团队发布 引入关键MCP功能支持-项目/模型网址:
GitHub
PaddleOCR 3.1版由百度AI团队发布 引入关键MCP功能支持

PaddleOCR 3.1 版本于 2025 年 6 月 29 日发布,新增了多项功能和优化。其中,关键能力支持了 MCP(Multi-Call Protocol,多调用协议),具体支持内容如下:

MCP 服务器支持

  • 支持工具:MCP 服务器支持 OCR 和 PP-StructureV3 两种工具。
  • 工作模式:支持本地 Python 库、星河社区云服务、自托管服务三种工作模式。
  • 调用方式:支持通过 stdio 调用本地服务,以及通过 Streamable HTTP 调用远程服务。

其他更新

  • 多语种识别:新增 PP-OCRv5 多语种文本识别模型,支持法语、西班牙语、葡萄牙语、俄语、韩语等 37 种语言的文字识别,平均精度涨幅超 30%。
  • 文档翻译产线:新增基于 PP-StructureV3 和 ERNIE 4.5 Turbo 的文档翻译产线 PP-DocTranslation,支持翻译 Markdown 格式文档、各种复杂版式的 PDF 文档和文档图像。

PaddleOCR 3.1 版本通过支持 MCP,进一步提升了其在多场景下的部署灵活性和易用性,同时在多语种识别和文档处理方面也取得了显著进步。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复