谷歌AI新星转投Pika:视频生成Lumiere一作,担任创始科学家

谷歌AI新星转投Pika:视频生成Lumiere一作,担任创始科学家

    正在检查是否收录...

视频生成进展如火如荼,Pika迎来一位大将——

谷歌研究员Omer Bar-Tal

,担任Pika

创始科学家

一个月前,还在谷歌以共同一作的身份发布视频生成模型

Lumiere

,效果十分惊艳。

当时网友表示:谷歌加入视频生成战局,又有好戏可看了。

Stability AI CEO、谷歌前同事等在内一些业内人士送上了祝福。


Lumiere一作,刚硕士毕业

Omer Bar-Tal

,2021年本科毕业于特拉维夫大学的数学与计算机系,随后前往魏茨曼科学研究所攻读计算机硕士,主要聚焦于图像和视频合成领域的研究。

其论文成果多次被顶会接收,比如Text2LIVE(ECCV 2022 Oral)、MultiDiffusion(ICML 2023)、TokenFlow(ICLR 2024)。

以TokenFlow为例,他们提出了一种框架,基于扩散模型实现文本驱动的视频编辑,支持视频编辑任务无需任何训练或微调。

此次加盟Pika前,他曾是谷歌研究院以Student Researcher身份待了9个月,最终经过7个月的研究以共同一作身份推出了

Lumiere

。这时候硕士应该还没有毕业。

Lumiere的创新点在于,提出了时空U-Net(STU-Net)架构:将视频在空间和时间两个维度同时进行下采样和上采样,在网络的中间层得到视频的压缩时空表示。

在学习了3000万视频之后,Lumiere可支持文生视频、视频编辑修复、图片转视频以及视频风格化等多种功能。

当时Jeff Dean盛赞:

多模态视频生成革命正在发生

威尔史密斯吃面(Pika版)

官宣加盟Pika消息之后,官方以及投资人等也送上了祝福。

前几天,还有位Pika华人研究员Yilun Du发布了篇文章, 不过应该刚从MIT博士毕业(也可能还没毕业),论文单位仍是MIT。

另外在官网还在继续招人中。


视频生成视频编辑flow研究员token多模态扩散模型生成模型视频合成风格化文本驱动科学家科学研究diffusion2024支持视频
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-8545.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

GPT-4正接管人类数据专家!先验知识让LLM大胆预测,准确率堪比传统方式

上一篇

干货满满!大神Karpathy两小时AI大课文字版第一弹,全新工作流自动把视频转成文章

下一篇
  • 复制图片
按住ctrl可打开默认菜单