【AIGC评测体系】大模型评测指标集

【AIGC评测体系】大模型评测指标集

    正在检查是否收录...

大模型评测指标集

(☆)SuperCLUE (1)SuperCLUE-V(中文原生多模态理解测评基准) (2)SuperCLUE-Auto(汽车大模型测评基准) (3)AIGVBench-T2V(文生视频基准测评) (4)SuperCLUE-Coder(代码助手测评基准) (5)SuperCLUE-RAG(中文原生检索增强生成测评基准) (6)SuperCLUE-Agent(Agent能力测评基准) (7)SuperCLUE-Image(中文原生文生图测评基准) (8)“巢燧”(大模型测评基准) (9)RAGAs(RAG性能测评)

(☆)SuperCLUE

CLUE官网: https://www.CLUEBenchmarks.com SuperCLUE排行榜网站: https://www.superclueai.com Github地址: https://github.com/CLUEbenchmark/SuperCLUE

(1)SuperCLUE-V(中文原生多模态理解测评基准)

推荐文章: SuperCLUE-V: 中文原生多模态理解测评基准 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-V

(2)SuperCLUE-Auto(汽车大模型测评基准)

推荐文章: SuperCLUE-Auto:首个汽车行业中文大模型测评基准发布 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-auto

(3)AIGVBench-T2V(文生视频基准测评)

推荐文章: AIGVBench文生视频测评首期结果公布,1000个AI视频对比,最高72.9分,Luma仅第3 AIGVBench登录页: www.AIGVBench.com

(4)SuperCLUE-Coder(代码助手测评基准)

推荐文章: 代码助手测评」启动,SC-Coder测评方案公布

(5)SuperCLUE-RAG(中文原生检索增强生成测评基准)

推荐文章: 中文RAG检索增强生成榜单出炉!仅有一家刚刚及格 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-RAG

(6)SuperCLUE-Agent(Agent能力测评基准)

推荐文章: SuperCLUE-Agent: Agent智能体中文原生任务能力测评基准 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-Agent

(7)SuperCLUE-Image(中文原生文生图测评基准)

推荐文章: 文生图大模型基准测评首期榜单公布,DALL-E 3取得最高76.94分 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-Image

(8)“巢燧”(大模型测评基准)

推荐文章: “巢燧”大模型基准综合评测:国内大模型中文能力首超GPT-4,多个中文大模型超过GPT-3.5 项目地址: http://openeval.org.cn/

(9)RAGAs(RAG性能测评)

推荐文章: RAGAs评估 项目地址: https://github.com/explodinggradients/ragas

rag大模型githubgit多模态理解文生图code多模态检索增强检索增强生成代码助手gptai视频dall-e 3智能体排行榜dall-egpt-3gpt-4gpt-3.5
  • 本文作者:WAP站长网
  • 本文链接: https://wapzz.net/post-17840.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.8W+
9
1
2
WAP站长官方

【AIGC 概念理解】Zero-Shot,One-Shot,Few-Shot,In-Context Learning,Tuning-Free/Training-Free/Inference-Only

上一篇

stable diffusion 提示词进阶语法-学习小结

下一篇
  • 复制图片
按住ctrl可打开默认菜单