超越Sora!AI视频模型StreamingT2V可生成120秒超长视频

超越Sora!AI视频模型StreamingT2V可生成120秒超长视频

    正在检查是否收录...

近日,UT奥斯丁等机构提出的StreamingT2V技术引发了广泛关注,将AI视频生成推向了新的高度。这项技术突破了以往视频长度的限制,实现了生成高度一致且长度可扩展的视频。

StreamingT2V技术的核心构架包括条件注意力模块(CAM)和外观保持模块(APM)。CAM利用短期记忆单元确保视频连续性,而APM作为长期记忆单元保持视频中对象或场景的一致性。这两个模块的结合,使得生成的视频不仅动态连贯,而且视觉效果高质量。在测试中,研究人员用Streaming T2V生成1200帧,长达2分钟的视频。

具体实现方法分为三个阶段:初始化、Streaming T2V生成和Streaming Refinement。在初始化阶段,利用文本到视频模型创造视频的前16帧;接着进入Streaming T2V阶段,通过自回归技术生成后续帧,保证视频内容连贯性;最后,在Streaming Refinement阶段对生成的视频进行优化,提高画质和动态效果。

特色亮点包括:

从文本描述生成2分钟的视频

创建具有复杂动态运动的视频

确保长视频中的时间一致性

该技术的出现标志着AI视频生成的新突破,不仅可以生成1200帧甚至无限长的视频,而且内容过渡自然平滑,丰富多样。与此同时,StreamingT2V技术的不断完善和提升也将进一步推动AI视频生成领域的发展,为视频内容创作提供更多可能性。

项目入口:https://top.aibase.com/tool/streamingt2v

论文地址:https://arxiv.org/abs/2403.14773

ai视频视频生成ai视频生成一致性视频内容长期记忆长视频描述生成动态效果可扩展研究人员内容创作视觉效果注意力文本到视频高质量arxiv
  • 本文作者:WAP站长网
  • 本文链接: https://wapzz.net/post-11819.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.8W+
9
1
2
WAP站长官方

stable-diffusion-webui中stability的sdv1.5和sdxl模型结构config对比

上一篇

OpenAI颠覆导演!首批7个Sora超现实大片震惊好莱坞

下一篇
  • 复制图片
按住ctrl可打开默认菜单