【Stable Diffusion】FID、CLIP、cfg-scales都是什么

【Stable Diffusion】FID、CLIP、cfg-scales都是什么

    正在检查是否收录...

在stable-diffusion 仓库中,是这样评价模型的。

Evaluations with different classifier-free guidance scales (1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0) and 50 PLMS sampling steps show the relative improvements of the checkpoints,

对应了这张图

图里的FID score 、Clip score 和 cfg-scales 都是什么意思呢?

FID score

FID(Fréchet Inception Distance ) score 是一种用于评估生成图像质量的度量标准,专门用于评估模型生成图片的性能,计算公式如下所示:

F I D ( p , q ) = ∣ ∣ μ p − μ q ∣ ∣ 2 2 + T r ( C p + C q − 2 C p C q ) \mathrm{FID}(p, q) = ||\mu_p - \mu_q||_2^2 + \mathrm{Tr}(C_p + C_q - 2\sqrt{C_pC_q}) FID(p,q)=∣∣μp​−μq​

sifcli模型生成lmsdiffusion图像质量clipgui评价模型计算公式url
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-1083.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
1.2W+
5
0
1
WAP站长官方

Reno11系列全新支持「闪速抠图」,端侧AI模型赋能高效创作

上一篇

中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT

下一篇
  • 复制图片
按住ctrl可打开默认菜单