超越Sora！AI视频模型StreamingT2V可生成120秒超长视频

游客

神秘用户已躺平...

您未登录！
愿美好瞬间与您不期而遇

登录注册

超越Sora！AI视频模型StreamingT2V可生成120秒超长视频

WAP站长网

超越Sora！AI视频模型StreamingT2V可生成120秒超长视频

超越Sora！AI视频模型StreamingT2V可生成120秒超长视频

2025年6月24日

字数：728，阅读约3分钟

全屏显示

超越Sora！AI视频模型StreamingT2V可生成120秒超长视频

31

0

正在检查是否收录...

近日，UT奥斯丁等机构提出的StreamingT2V技术引发了广泛关注，将AI视频生成推向了新的高度。这项技术突破了以往视频长度的限制，实现了生成高度一致且长度可扩展的视频。

StreamingT2V技术的核心构架包括条件注意力模块（CAM）和外观保持模块(APM)。CAM利用短期记忆单元确保视频连续性，而APM作为长期记忆单元保持视频中对象或场景的一致性。这两个模块的结合，使得生成的视频不仅动态连贯，而且视觉效果高质量。在测试中，研究人员用Streaming T2V生成1200帧，长达2分钟的视频。

具体实现方法分为三个阶段:初始化、Streaming T2V生成和Streaming Refinement。在初始化阶段，利用文本到视频模型创造视频的前16帧;接着进入Streaming T2V阶段，通过自回归技术生成后续帧，保证视频内容连贯性;最后，在Streaming Refinement阶段对生成的视频进行优化，提高画质和动态效果。

特色亮点包括：

从文本描述生成2分钟的视频

创建具有复杂动态运动的视频

确保长视频中的时间一致性

该技术的出现标志着AI视频生成的新突破，不仅可以生成1200帧甚至无限长的视频，而且内容过渡自然平滑，丰富多样。与此同时，StreamingT2V技术的不断完善和提升也将进一步推动AI视频生成领域的发展，为视频内容创作提供更多可能性。

项目入口：https://top.aibase.com/tool/streamingt2v

论文地址:https://arxiv.org/abs/2403.14773

ai视频视频生成ai视频生成一致性视频内容长期记忆长视频描述生成动态效果可扩展研究人员内容创作视觉效果注意力文本到视频高质量arxiv

本文作者：WAP站长网
本文链接： https://wapzz.net/post-11819.html
版权声明：本博客所有文章除特别声明外，均默认采用 CC BY-NC-SA 4.0 许可协议。

本站部分内容来源于网络转载，仅供学习交流使用。如涉及版权问题，请及时联系我们，我们将第一时间处理。

文章很赞！支持一下吧还没有人为TA充电

为TA充电

还没有人为TA充电

0

0

支付宝扫一扫
微信扫一扫

感谢支持

文章很赞！支持一下吧

关于作者

WAP站长网

2.8W+

9

1

2

WAP站长官方

最近签到
签到排行

WAP站长网
1个月前
+20
kbx991
1个月前
+30
vPNpL7l4
1个月前
+10

WAP站长网
WAP站长官方
57
kbx991
内卷太严重，已躺平...
6
Cr8M6e32
内卷太严重，已躺平...
5

热门文章

TOP1

TOP2

日均播放量超过25亿，为什么“最流行”的美妆趋势诞生于抖音？

TOP3

TOP4

TOP5

标签云

麒麟9020A性能 1

华为Mate70优享版 1

性能提升 1

麒麟9020A 1

Mate70优享版 1

K90 1

Gen5芯片 1

K90系列 1

X9系列 1

荣耀Magic8系列 1

X300系列 1

小米员工处分 1

王腾被辞退 1

泄露公司机密 1

小米员工违规 1

王腾账号注销 1

YU7防护措施 1

小米YU7电池安全 1

防护措施 1

上市咨询 1

电池安全 1

合约机 1

中国联通 1

小米汽车技术解释 1

小米超强钢项目 1

东北大学 1

项目名称 1

超强钢 1

淘宝团购 1

阿里流量入口 1

团购业务 1

跨界月饼 1

月饼邪修 1

创意月饼 1

年轻人消费 1

中秋礼盒 1

月饼测评 1

抖音鸡排哥 1

鸡排哥语录 1

抖音爆火 1

幽默互动 1

网络走红 1

鸡排哥 1

AI稀疏注意力 1

V3.2 1

API成本 1

稀疏注意力 1

照片在线下载 1

10G文件传输 1

在线预览 1

复制图片
复制图片地址

深色模式
轉為繁體
前往顶部
前往底部

按住ctrl可打开默认菜单