最近几天,相信大家在网上看到了大量的AI生成视频,质量大幅提升,甚至到了真假难分的地步,十分火爆。这是由于在前一段时间,字节跳动开始小范围内测AI视频生成模型Seedance 2.0,可根据文本或图像创建电影级视频,效果出乎了许多人的预料。

相比于之前提供的1.5版本,Seedance 2.0的生成质量大幅提升,在复杂交互和运动场景下的可用率更高,物理准确度、逼真度、可控性显著增强,更加贴合工业级创作场景的需求。Seedance 2.0核心亮点包括:
复杂场景下更高可用率 - 凭借出色的运动稳定性和物理还原能力,模型在多主体交互和复杂运动场景中表现出色,生成可用率达到业界SOTA水平。
多模态能力显著强化 - 基于统一的多模态音视频联合架构训练,支持混合模态输入,允许用户同时输入多达9张图片、3段视频、3段音频以及自然语言指令,模型可参考输入素材中的构图、动作、运镜、特效、声音等元素,打破传统视频生成的素材边界。
