ID-LoRA:单图短音频驱动,统一音视频身份保真生成开源框架
ID-LoRA是基于LTX‑2/LTX‑2.3联合音视频扩散基座打造的零样本、轻量、端到端说话人生成开源项目,仅需单张人脸参考图+5秒左右参考音频,即可生成人脸高度一致、音色精准复...
ID-LoRA是基于LTX‑2/LTX‑2.3联合音视频扩散基座打造的零样本、轻量、端到端说话人生成开源项目,仅需单张人脸参考图+5秒左右参考音频,即可生成人脸高度一致、音色精准复...
InteractAvatar是一款开源的文本驱动、场景感知、人物-物体交互可控的说话数字人(Talking Avatar)生成框架,核心解决当前数字人生成领域长期存在的控制-质量两难问题——...
PersonaLive是一款面向实时数字人交互场景的开源AI框架,核心定位是“低门槛、高性能的实时人像动画生成工具”,由澳门大学、dzine.ai与大湾区大学GVC实验室联合研发并开源...