stable-diffusion | v1-5-pruned.ckpt和v1-5-pruned-emaonly.ckpt的区别

stable-diffusion | v1-5-pruned.ckpt和v1-5-pruned-emaonly.ckpt的区别

    正在检查是否收录...

https://github.com/runwayml/stable-diffusion?tab=readme-ov-file#reference-sampling-script


对于 1.5 模型,其中可能包括四部分:标准模型、文本编码器、VAE模型、EMA模型。

标准模型:生成图片的核心模块,潜空间中的前向扩散和反向扩散就是通过它做的,对应到图中左侧的 U-Net。

文本编码器:将文本提示词转换为数学向量,然后用作生成图片的引导条件。全称是 Text Encoder,对应到图中的TE。

VAE模型:用于图像在像素空间和潜在空间的映射,生成图片时将图像从潜在空间转换为像素图片,目前大部分模型都自带VAE。

EMA模型:EMA是一种算法,用来稳定模型效果的。对于日常生成,我们只要了解这样一个事实就行了:如果只是生成,EMA模型和标准模型的效果是一样的。如果你要做二次训练,并且显卡够好,选择带EMA的模型可能更好,因为所有数据都在;当然选择去EMA的模型也能做二次训练。

https://mp.weixin.qq.com/s/Ka5lnzcyFv2zdifo-Q81HQ

文本编码github文本提示git提示词diffusioncodescript稳定模型
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-8223.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

AI 可以生成前端代码吗?

上一篇

AI换脸乌克兰美女在中国赚钱:软件费用每月仅72美元

下一篇
  • 复制图片
按住ctrl可打开默认菜单