新
AIGC官网收录 │
2025-07-03 │
6 次 │
人工核对 │
官网认证 │
定期更新 │
AI大模型
官网入口为官方网站入口;IOS为App Store下载渠道,支持iPad/iPhone/Mac;安卓为谷歌应用商店/腾讯应用宝下载渠道;客户端为官方下载渠道,支持Mac/Windows PC电脑端下载,iPad/iPhone/Android下载;插件为浏览器(默认“Chrome”)插件下载渠道;GitHub为模型/软件项目的GitHub托管平台;API为模型/软件的API接口;MCP为官网MCP栏目;以上无展示,则暂无对应渠道。欢迎广大网友,提供/纠错以上渠道。
C-Eval 图文介绍:
C-Eval 是一个面向中文基础模型的综合性评测套件,旨在通过标准化、多维度、多学科的测试,客观衡量模型在知识理解、推理能力、学科覆盖等方面的表现。评测数据涵盖人文社科、自然科学、工程技术等52个学科,难度分为初级、中级、高级和专家级,是目前中文领域最全面的模型评测基准之一。
主要功能
- 多层级评测:按难度分级(初级至专家级),精准定位模型能力边界。
- 多学科覆盖:52个学科(如数学、历史、医学、法律等),全面检验模型知识广度。
- 标准化数据集:13948道高质量多选题,支持一键评测与结果复现。
- 开源可扩展:提供评测代码与数据集,支持社区共建与持续迭代。
应用场景
- 模型研发:帮助开发者快速定位模型短板,优化训练策略。
- 学术研究:为中文大模型研究提供统一评测标准,推动领域发展。
- 行业选型:企业可依据评测结果选择适配场景的模型,降低试错成本。
是否收费
- 完全免费,数据集、评测工具及结果均开源。
平台兼容性
- 支持主流深度学习框架(PyTorch、TensorFlow等),兼容Linux/Windows/macOS系统,适配云端与本地部署。
C-Eval 以科学、开放、权威为核心,填补了中文大模型评测领域的空白,成为学术界与产业界评估模型能力的“标尺”。其多层级、多学科的设计不仅助力模型迭代,也为中文AI生态的标准化奠定了基础。 (注:用户可通过官网cevalbenchmark.com获取完整数据集与评测工具。)
©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
Cephalon Cloud提供AI智能体和大模型服务,助力企业智能化转型。