首页 > 快讯 > 腾讯混元携手中外机构发布古文字OCR评测基准Chronicles-OCR，为业界首个

腾讯混元携手中外机构发布古文字OCR评测基准Chronicles-OCR，为业界首个

发布时间：2026-05-19 09:39:38 | 责任编辑：吴昊 | 浏览量：26 次

5月18日，腾讯混元、SSV数字文化实验室及SSV技术架构部联合安阳师范学院甲骨文信息处理重点实验室、中科院信工所、南开大学，正式发布了业界首个覆盖“七体之变”完整演化轨迹的中国古文字识别评测基准Chronicles-OCR。该基准的推出，旨在精准衡量多模态大语言模型（VLLM）在面对横跨三千年的汉字视觉分布漂移时的感知能力，推动数字人文领域的底层技术突破。
该数据集由领域专家多层级交叉标注，包含2，800张严格平衡的高质量图像。针对古早字体（甲骨、金文、篆书）与成熟字体(隶、楷、行、草)的特性，项目组设计了阶段自适应标注范式，并设立跨时代字符检测、细粒度古字识别、古文转写和字体分类四大核心任务，实现了视觉感知与语义推理的解耦评测。
在对GPT-5、Gemini3.1Pro、Claude Opus4.7等28个主流大模型的评测中，基准揭示了当前行业多模态能力的短板:在古早字体上，端到端检测任务由于缺乏现代版式先验而导致主流模型全军覆没;在细粒度识别中，最高准确率仅为27.1%;而在字体分类任务中，模型倾向于识别载体纹理而非微观笔画。值得注意的是，实验表明开启推理（Reasoning）模式反而会放大感知不确定性，导致表现下降。
此次 Chronicles-OCR 的开源发布，不仅量化了顶尖商用模型与古文字实际研究需求之间的技术鸿沟，也为学术界和工业界明确了微观感知优化的技术路径。让大模型从“识字”走向“读史”，将成为多模态大模型攻克长尾垂直场景、传承文化遗产的关键一步。

这是一篇关于腾讯混元等联合发布首个古文字OCR评测基准 Chronicles-OCR的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：不卷模型卷生态？Anthropic收购Stainless揭示：大模型竞争转向“开发者体验”新阶段

下一篇：百度公布2026年第一季度业绩：总营收达321亿元，AI业务收入占比首次突破52%

腾讯混元携手中外机构发布古文字OCR评测基准Chronicles-OCR，为业界首个

最新Ai信息

最新Ai工具

热门AI推荐