每日AIGC最新进展(28)：鹏城实验室提出连贯的故事生成框架StoryImager、浙大强化学习提升扩散模型生成质量算法PXPO、谷歌提出生成中文/日文/韩文字符的扩散模型

正在检查是否收录...

Diffusion Models专栏文章汇总：入门与实战

StoryImager: A Unified and Efficient Framework for Coherent Story Visualization and Completion

本文介绍了一种名为StoryImager的新型统一高效框架，用于连贯的故事可视化和完成。该框架旨在基于故事情节生成一系列真实且连贯的图像。StoryImager通过双向生成能力，克服了现有模型在自回归生成方式、高计算成本和独立训练推断等方面的限制。它通过引入目标帧遮蔽策略、帧-故事交叉注意力模块和上下文特征提取器，提高了故事图像生成的质量和连贯性。

可视化图像生成上下文注意力diffusion故事情节提取器