FlagEval 官网

官网入口

国家/地区：中国🇨🇳
AI功能描述：FlagEval（天秤）是一个科学、公正、开放的大模型评测体系及开放平台，提供多样化的评测工具和数据集，帮助研究人员全面评估基础模型及训练算法的性能。

说明: 官网入口 官方网站主页； IOS App Store 下载，支持 iPhone/iPad/Mac；安卓 Google Play / 应用宝下载； 客户端 Mac/Windows/iOS/Android 官方下载；插件浏览器插件（默认 Chrome）； GitHub / HuggingFace / ModelScope 模型或项目托管地址； API 模型/软件接口地址； MCP 官网的 MCP 栏目入口。若未显示，表示暂无对应渠道，欢迎补充或纠错。

AIGC官网收录 │ 2025-07-03 │ 440 次 │ 人工核对 │ 官网认证 │ 定期更新 │ AI开放平台

FlagEval 图文介绍：

FlagEval（天秤）是由北京智源人工智能研究院推出的AI大模型评测体系及开放平台。该平台旨在建立科学、公正、开放的评测基准、方法和工具集，协助研究人员全方位评估基础模型及训练算法的性能。通过引入AI辅助主观评测，FlagEval大幅提升了评测的效率和客观性。

主要功能

多样化评测任务：提供语言大模型、多模态大模型、计算机视觉和语音语言大模型等多种评测任务。
语言大模型评测：简单理解数学能力代码能力知识运用推理能力任务解决指令遵循安全与价值观
多模态大模型评测：视觉语言模型文生图文生视频
计算机视觉评测：深度估计图像分类图像检索语义分割半监督图像分类小样本图像分类
语音语言大模型评测：语音感知能力音频感知能力语音生成能力口语理解能力

应用场景

学术研究：为研究人员提供标准化的评测工具，帮助他们评估和改进模型性能。
工业应用：企业可以利用该平台评估和选择适合其业务需求的AI模型。
教育领域：教育机构可以使用该平台进行教学和研究，培养学生的AI评测能力。

是否收费

FlagEval作为开放平台，目前提供免费服务，用户可以免费使用其评测工具和数据集。

平台兼容性

FlagEval主要通过其网站提供服务，支持所有主流浏览器，用户可以在任何支持Web的设备上使用该平台。

FlagEval（天秤）通过其全面的评测工具和丰富的数据集，为AI研究人员和开发者提供了一个科学、公正、开放的评测平台。无论是在学术研究、工业应用还是教育领域，FlagEval都能帮助用户高效、客观地评估AI模型的性能，推动AI技术的发展和应用。

©️版权声明：
本网站(AIGC官网)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

FlagEval 官网

FlagEval 图文介绍：

主要功能

应用场景

是否收费

平台兼容性

相关导航

最新Ai工具

热门AI推荐

发表回复