MuseTalk:腾讯音乐开源的AI音频驱动唇形同步生成模型
MuseTalk是腾讯音乐娱乐集团Lyra Lab开源的实时高保真音频驱动唇形同步模型,基于latent空间修复技术,支持中文/英文/日语等多语言音频输入,可对256×256人脸区域精准唇形...
MuseTalk是腾讯音乐娱乐集团Lyra Lab开源的实时高保真音频驱动唇形同步模型,基于latent空间修复技术,支持中文/英文/日语等多语言音频输入,可对256×256人脸区域精准唇形...
ID-LoRA是基于LTX‑2/LTX‑2.3联合音视频扩散基座打造的零样本、轻量、端到端说话人生成开源项目,仅需单张人脸参考图+5秒左右参考音频,即可生成人脸高度一致、音色精准复...
InteractAvatar是一款开源的文本驱动、场景感知、人物-物体交互可控的说话数字人(Talking Avatar)生成框架,核心解决当前数字人生成领域长期存在的控制-质量两难问题——...
PersonaLive是一款面向实时数字人交互场景的开源AI框架,核心定位是“低门槛、高性能的实时人像动画生成工具”,由澳门大学、dzine.ai与大湾区大学GVC实验室联合研发并开源...