WAP站长网

2025年6月24日

字数：816，阅读约3分钟

全屏显示

谷歌AI新星转投Pika：视频生成Lumiere一作，担任创始科学家

SEO教程

正在检查是否收录...

视频生成进展如火如荼，Pika迎来一位大将——

谷歌研究员Omer Bar-Tal

，担任Pika

创始科学家

。

一个月前，还在谷歌以共同一作的身份发布视频生成模型

Lumiere

，效果十分惊艳。

当时网友表示：谷歌加入视频生成战局，又有好戏可看了。

Stability AI CEO、谷歌前同事等在内一些业内人士送上了祝福。

Lumiere一作，刚硕士毕业

Omer Bar-Tal

，2021年本科毕业于特拉维夫大学的数学与计算机系，随后前往魏茨曼科学研究所攻读计算机硕士，主要聚焦于图像和视频合成领域的研究。

其论文成果多次被顶会接收，比如Text2LIVE（ECCV 2022 Oral）、MultiDiffusion（ICML 2023）、TokenFlow（ICLR 2024）。

以TokenFlow为例，他们提出了一种框架，基于扩散模型实现文本驱动的视频编辑，支持视频编辑任务无需任何训练或微调。

此次加盟Pika前，他曾是谷歌研究院以Student Researcher身份待了9个月，最终经过7个月的研究以共同一作身份推出了

Lumiere

。这时候硕士应该还没有毕业。

Lumiere的创新点在于，提出了时空U-Net（STU-Net）架构：将视频在空间和时间两个维度同时进行下采样和上采样，在网络的中间层得到视频的压缩时空表示。

在学习了3000万视频之后，Lumiere可支持文生视频、视频编辑修复、图片转视频以及视频风格化等多种功能。

当时Jeff Dean盛赞：

多模态视频生成革命正在发生

。

威尔史密斯吃面（Pika版）

官宣加盟Pika消息之后，官方以及投资人等也送上了祝福。

前几天，还有位Pika华人研究员Yilun Du发布了篇文章，不过应该刚从MIT博士毕业（也可能还没毕业），论文单位仍是MIT。

另外在官网还在继续招人中。

视频生成视频编辑flow研究员token多模态扩散模型生成模型视频合成风格化文本驱动科学家科学研究diffusion2024支持视频

本文作者：WAP站长网
本文链接： https://wapzz.net/post-8545.html
版权声明：本博客所有文章除特别声明外，均默认采用 CC BY-NC-SA 4.0 许可协议。

本站部分内容来源于网络转载，仅供学习交流使用。如涉及版权问题，请及时联系我们，我们将第一时间处理。

文章很赞！支持一下吧还没有人为TA充电

为TA充电

还没有人为TA充电

支付宝扫一扫
微信扫一扫

感谢支持

文章很赞！支持一下吧

关于作者

WAP站长网

2.8W+

WAP站长官方

最近签到
签到排行

WAP站长网
1个月前
+20
kbx991
1个月前
+30
vPNpL7l4
1个月前
+10

WAP站长网
WAP站长官方
57
kbx991
内卷太严重，已躺平...
6
Cr8M6e32
内卷太严重，已躺平...
5

日均播放量超过25亿，为什么“最流行”的美妆趋势诞生于抖音？

TOP3

TOP4

TOP5

超百万人围观，带动1.1万单交易，抖音后厨直播大战带飞线下消费

标签云

吃喝玩乐一卡通 1

小红卡用户 1

小红卡 1

森贝儿IP 1

小鼻嘎玩具 1

萌粒 1

迷你玩具 1

森贝儿家族 1

小鼻嘎 1

电商工具优化 1

商家运营压力 1

商家工具 1

双11大促 1

电商运营 1

马斯克财富 1

特斯拉市值 1

马斯克 1

科技股 1

美股 1

新车交付量 1

鸿蒙智行销量 1

国庆服务 1

新车交付 1

销量增长 1

麒麟9020A性能 1

华为Mate70优享版 1

性能提升 1

麒麟9020A 1

Mate70优享版 1

K90 1

Gen5芯片 1

K90系列 1

X9系列 1

荣耀Magic8系列 1

X300系列 1

小米员工处分 1

王腾被辞退 1

泄露公司机密 1

小米员工违规 1

王腾账号注销 1

YU7防护措施 1

小米YU7电池安全 1

防护措施 1

上市咨询 1

电池安全 1

合约机 1

中国联通 1

小米汽车技术解释 1

小米超强钢项目 1

东北大学 1