每日AIGC最新进展(28):鹏城实验室提出连贯的故事生成框架StoryImager、浙大强化学习提升扩散模型生成质量算法PXPO、谷歌提出生成中文/日文/韩文字符的扩散模型

每日AIGC最新进展(28):鹏城实验室提出连贯的故事生成框架StoryImager、浙大强化学习提升扩散模型生成质量算法PXPO、谷歌提出生成中文/日文/韩文字符的扩散模型

    正在检查是否收录...
一言准备中...

Diffusion Models专栏文章汇总:入门与实战

StoryImager: A Unified and Efficient Framework for Coherent Story Visualization and Completion

本文介绍了一种名为StoryImager的新型统一高效框架,用于连贯的故事可视化和完成。该框架旨在基于故事情节生成一系列真实且连贯的图像。StoryImager通过双向生成能力,克服了现有模型在自回归生成方式、高计算成本和独立训练推断等方面的限制。它通过引入目标帧遮蔽策略、帧-故事交叉注意力模块和上下文特征提取器,提高了故事图像生成的质量和连贯性。

可视化图像生成上下文注意力diffusion故事情节提取器
  • 本文作者:WAP站长网
  • 本文链接: https://wapzz.net/post-17165.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.7W+
9
1
2
WAP站长官方

Llama 3-V: 比GPT4-V小100倍的SOTA

上一篇

文字游侠:一款全新AI写作模型,每天10分钟一键创作爆文!附渠道和玩法教程!

下一篇
  • 复制图片
按住ctrl可打开默认菜单