C-Eval 官网

官网入口

国家/地区：中国🇨🇳
AI功能描述：C-Eval 是由上海交通大学、清华大学等联合推出的中文大模型多层级、多学科评测基准，覆盖52个学科、13948道多选题，为模型能力提供科学量化评估。

说明: 官网入口 官方网站主页； IOS App Store 下载，支持 iPhone/iPad/Mac；安卓 Google Play / 应用宝下载； 客户端 Mac/Windows/iOS/Android 官方下载；插件浏览器插件（默认 Chrome）； GitHub / HuggingFace / ModelScope 模型或项目托管地址； API 模型/软件接口地址； MCP 官网的 MCP 栏目入口。若未显示，表示暂无对应渠道，欢迎补充或纠错。

AIGC官网收录 │ 2025-07-03 │ 687 次 │ 人工核对 │ 官网认证 │ 定期更新 │ AI大模型

C-Eval 图文介绍：

C-Eval 是一个面向中文基础模型的综合性评测套件，旨在通过标准化、多维度、多学科的测试，客观衡量模型在知识理解、推理能力、学科覆盖等方面的表现。评测数据涵盖人文社科、自然科学、工程技术等52个学科，难度分为初级、中级、高级和专家级，是目前中文领域最全面的模型评测基准之一。

主要功能

多层级评测：按难度分级（初级至专家级），精准定位模型能力边界。
多学科覆盖：52个学科（如数学、历史、医学、法律等），全面检验模型知识广度。
标准化数据集：13948道高质量多选题，支持一键评测与结果复现。
开源可扩展：提供评测代码与数据集，支持社区共建与持续迭代。

应用场景

模型研发：帮助开发者快速定位模型短板，优化训练策略。
学术研究：为中文大模型研究提供统一评测标准，推动领域发展。
行业选型：企业可依据评测结果选择适配场景的模型，降低试错成本。

是否收费

完全免费，数据集、评测工具及结果均开源。

平台兼容性

支持主流深度学习框架（PyTorch、TensorFlow等），兼容Linux/Windows/macOS系统，适配云端与本地部署。

C-Eval 以科学、开放、权威为核心，填补了中文大模型评测领域的空白，成为学术界与产业界评估模型能力的“标尺”。其多层级、多学科的设计不仅助力模型迭代，也为中文AI生态的标准化奠定了基础。（注：用户可通过官网cevalbenchmark.com获取完整数据集与评测工具。）

©️版权声明：
本网站(AIGC官网)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

C-Eval 官网

C-Eval 图文介绍：

主要功能

应用场景

是否收费

平台兼容性

相关导航

最新Ai工具

热门AI推荐

发表回复