每日AIGC最新进展(28):鹏城实验室提出连贯的故事生成框架StoryImager、浙大强化学习提升扩散模型生成质量算法PXPO、谷歌提出生成中文/日文/韩文字符的扩散模型
Diffusion Models专栏文章汇总:入门与实战
StoryImager: A Unified and Efficient Framework for Coherent Story Visualization and Completion
本文介绍了一种名为StoryImager的新型统一高效框架,用于连贯的故事可视化和完成。该框架旨在基于故事情节生成一系列真实且连贯的图像。StoryImager通过双向生成能力,克服了现有模型在自回归生成方式、高计算成本和独立训练推断等方面的限制。它通过引入目标帧遮蔽策略、帧-故事交叉注意力模块和上下文特征提取器,提高了故事图像生成的质量和连贯性。
可视化图像生成上下文注意力diffusion故事情节提取器📚 推荐阅读
扫描二维码,在手机上阅读
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END