ID-LoRA:单图短音频驱动,统一音视频身份保真生成开源框架 ID-LoRA是基于LTX‑2/LTX‑2.3联合音视频扩散基座打造的零样本、轻量、端到端说话人生成开源项目,仅需单张人脸参考图+5秒左右参考音频,即可生成人脸高度一致、音色精准复... 2周前 AI新闻 91
MOVA:开源音视频同步生成基础模型,原生双模态同生与高精度唇形对齐 MOVA是由OpenMOSS团队研发的开源音视频同步生成基础模型,其采用非对称双塔架构与双向交叉注意力机制,在多语言唇形同步、环境音效匹配上达到领先水平,全栈开放模型权重、... 2个月前 AI新闻 161