MAGI-1 - 开源项目导航网开源项目导航网

大模型视频处理

MAGI-1

链接直达手机查看

我们提出了 MAGI-1，这是一个世界模型，它通过自回归预测一系列视频块（定义为固定长度的连续帧片段）来生成视频。MAGI-1 经过训练，可以去除随时间单调递增的单块噪声，从而实现因果时间建模，并自然支持流式生成。它在以文本指令为条件的图像到视频 (I2V) 任务中表现出色，提供了高度的时间一致性和可扩展性，这得益于多项算法创新和专用的基础架构堆栈。MAGI-1 还通过逐块提示支持可控生成，从而实现流畅的场景过渡、长时域合成和细粒度的文本驱动控制。我们相信，MAGI-1 为统一高保真视频生成、灵活的指令控制和实时部署提供了一个充满希望的方向。

相关导航

发表回复取消回复

相关导航

发表回复 取消回复

发表回复取消回复