Follow Your Pose 一个创新的文本到视频生成框架,它通过两阶段训练策略实现了高度的姿态控制和时间连贯性。该框架不仅能够根据文本描述生成视频,还能让用户通过姿态序列精确控制视频中角色的动作...
Seed-TTS Seed-TTS 是字节跳动开发的一系列大规模自回归文本到语音(TTS)模型,旨在生成高度自然、与人类语音几乎无法区分的语音。作为一个多功能的基础语音生成模型,Seed-TTS 在多个方面...