音视频生成

音视频生成新闻、工具、教程及资源推荐

ID-LoRA是基于LTX‑2/LTX‑2.3联合音视频扩散基座打造的零样本、轻量、端到端说话人生成开源项目，仅需单张人脸参考图+5秒左右参考音频，即可生成人脸高度一致、音色精准复...

MOVA是由OpenMOSS团队研发的开源音视频同步生成基础模型，其采用非对称双塔架构与双向交叉注意力机制，在多语言唇形同步、环境音效匹配上达到领先水平，全栈开放模型权重、...