DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion

DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion

    正在检查是否收录...
一言准备中...

UW&UCB&Google&NVIDIA ICCV23 https://github.com/johannakarras/DreamPose?tab=readme-ov-file 问题引入 输入参考图片 x 0 x_0 x0​和pose序列 { p 1 , ⋯   , p N } {p_1,\cdots,p_N} {p1​,⋯,pN​},输出对应视频 { x 1 ′ , ⋯   , x N ′ } {x_1',\cdots,x_N'} {x1′​,⋯,xN′​}; 模型在推理的时候是帧与帧之间是独立生成的; 将原本的文生图模型改造成pose&image guided video generation model; methods
appearence控制:Split CLIP-VAE Encoder,之前的方法将图片条件和noised latents结合到一起作为输入,但是这种方法是为了spatial的align,所以本文采取了另一种办法,也就是结合使用CLIP和VAE,最初和VAE embedding相关的权重设置为0,最后得到的embedding c I = A ( c C L I P , c V A E ) cI = A(c{CLIP},c_{VAE}) cI​=A(cCLIP​,cVAE​),其中 A A A代表adapter; pose控制:采用五个连续pose帧 c p = { p i − 2 , p i − 1 , p i , p i + 1 , p i + 2 } cp={p{i - 2},p_{i - 1},pi,p{i + 1},p{i + 2}} cp​={pi−2​,pi−1​,pi​,pi+1​,pi+2​},这些和noised latents concat到一起作为输入,输入修改了以接收额外的10个通道,初始化参数为0; 训练:根据上面的描述初始化模型参数之后,分为两个阶段进行训练,第一个阶段在完整数据集上面进行训练,第二个阶段在特定主题数据上进行微调; Pose and Image Classifier-Free Guidance: ϵ θ ( z t , c i , c p ) = ϵ θ ( z t , ∅ , ∅ ) + s I ( ϵ θ ( z t , c I , ∅ ) − ϵ θ ( z t , ∅ , ∅ ) ) + s p ( ϵ θ ( z t , c I , c p ) − ϵ θ ( z t , c I , ∅ ) ) \epsilon\theta(z_t,c_i,cp) = \epsilon\theta(z_t,\empty,\empty) + sI(\epsilon\theta(z_t,cI,\empty)-\epsilon\theta(z_t,\empty,\empty)) + sp(\epsilon\theta(z_t,c_I,cp)-\epsilon\theta(z_t,c_I,\empty)) ϵθ​(zt​,ci​,cp​)=ϵθ​(zt​,∅,∅)+sI​(ϵθ​(zt​,cI​,∅)−ϵθ​(zt​,∅,∅))+sp​(ϵθ​(zt​,cI​,cp​)−ϵθ​(zt​,cI​,∅)), s I s_I sI​保证和输入图片的appearence相符, s p s_p sp​保证和pose的align; 实验 UBC Fashion dataset

cliclipappideguisif文生图数据集githubgooglegitcodedream

  • 本文作者:WAP站长网
  • 本文链接: https://wapzz.net/post-15682.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.7W+
9
1
2
WAP站长官方

AI绘画,AI绘画大模型资料汇总,常见几个网站,搜不到答案用Edge,微软的搜索一下有时能找到解决问题的答案

上一篇

京东618开门红1小时战报出炉,AI硬件品类成交额同比增长260%

下一篇
  • 复制图片
按住ctrl可打开默认菜单