VideoPoet：Google发布的用于视频生成的大语言模型

VideoPoet是什么？

VideoPoet是Google发布的基于大语言模型（LLM）来实现视频生成的模型，之前主流视频生成模型如Stable Video Diffusion和Video Diffusion都是采用扩散架构，但VideoPoet是基于大语言模型（LLM）来实现视频生成的，即采用LLM的自回归架构。VideoPoet的一个特色是它将许多视频生成能力无缝集成到一个LLM中。

下图展示了VideoPoet的能力，它可以实现文本生成视频，图像生成视频，视频风格化，视频的inpainting和outpainting以及视频转语音。

下图是VideoPoet生成的一些视频示例：

了解更多详情，请前往谷歌官方介绍

近期文章

近期评论

归档

分类

近期文章

近期评论

归档

分类

发表回复取消回复

近期文章

近期评论

归档

分类

VideoPoet是什么？

发表回复 取消回复

相关文章

小白AI-集合全球主流AI模型，千万现金奖励

Clipchamp-微软旗下免费视频编辑软件

Imaiger-AI图像搜索和生成工具

探形 – 把工作交给 AI

发表回复取消回复