说明:
官网入口 官方网站主页;
IOS App Store 下载,支持 iPhone/iPad/Mac;
安卓 Google Play / 应用宝下载;
客户端 Mac/Windows/iOS/Android 官方下载;
插件 浏览器插件(默认 Chrome);
GitHub / HuggingFace / ModelScope 模型或项目托管地址;
API 模型/软件接口地址;
MCP 官网的 MCP 栏目入口。
若未显示,表示暂无对应渠道,欢迎补充或纠错。

AIGC官网收录 │
2025-07-03 │
53 次 │
人工核对 │
官网认证 │
定期更新 │
AI开放平台
FlagEval 图文介绍:
FlagEval(天秤)是由北京智源人工智能研究院推出的AI大模型评测体系及开放平台。该平台旨在建立科学、公正、开放的评测基准、方法和工具集,协助研究人员全方位评估基础模型及训练算法的性能。通过引入AI辅助主观评测,FlagEval大幅提升了评测的效率和客观性。
主要功能
- 多样化评测任务:提供语言大模型、多模态大模型、计算机视觉和语音语言大模型等多种评测任务。
- 语言大模型评测: 简单理解 数学能力 代码能力 知识运用 推理能力 任务解决 指令遵循 安全与价值观
- 多模态大模型评测: 视觉语言模型 文生图 文生视频
- 计算机视觉评测: 深度估计 图像分类 图像检索 语义分割 半监督图像分类 小样本图像分类
- 语音语言大模型评测: 语音感知能力 音频感知能力 语音生成能力 口语理解能力
应用场景
- 学术研究:为研究人员提供标准化的评测工具,帮助他们评估和改进模型性能。
- 工业应用:企业可以利用该平台评估和选择适合其业务需求的AI模型。
- 教育领域:教育机构可以使用该平台进行教学和研究,培养学生的AI评测能力。
是否收费
FlagEval作为开放平台,目前提供免费服务,用户可以免费使用其评测工具和数据集。
平台兼容性
FlagEval主要通过其网站提供服务,支持所有主流浏览器,用户可以在任何支持Web的设备上使用该平台。
FlagEval(天秤)通过其全面的评测工具和丰富的数据集,为AI研究人员和开发者提供了一个科学、公正、开放的评测平台。无论是在学术研究、工业应用还是教育领域,FlagEval都能帮助用户高效、客观地评估AI模型的性能,推动AI技术的发展和应用。
©️版权声明:
本网站(AIGC官网)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
本网站(AIGC官网)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
Syntho 通过自研 AI 引擎在客户本地一键生成高保真、零隐私风险的合成数据,帮助企业在合规前提下解锁数据共享、测试与分析。