FlagEval

大模型评测体系及开放平台

分类：工具集
标签：CN
收录：2025-09-13
访问：
更新：2026-07-05

FlagEval（天秤）大模型评测体系及开放平台，旨在建立科学、公正、开放的评测基准、方法、工具集，协助研究人员全方位评估基础模型及训练算法的性能，同时通过引入AI辅助主观评测，大幅提升评测的效率和客观性。

FlagEval官网 - 截图

相关推荐

POWER AI

全球最大的人工智能工具目录

Toolfolio

国外热门工具集合站

Toolscout

发现新的AI工具

TopAI

AI工具合集站，发现最新AI工具

TinWow

集合了PDF、视频、图像、写作的在线综合AI工具箱

OpenGPT

海量的 ChatGPT 应用，几秒钟创建自己的小工具

Media

便携式多功能在线AI工具

AI帮个忙

多功能AI小帮手