数字人

MuseTalk是腾讯音乐娱乐集团Lyra Lab开源的实时高保真音频驱动唇形同步模型，基于latent空间修复技术，支持中文/英文/日语等多语言音频输入，可对256×256人脸区域精准唇形...

ID-LoRA是基于LTX‑2/LTX‑2.3联合音视频扩散基座打造的零样本、轻量、端到端说话人生成开源项目，仅需单张人脸参考图+5秒左右参考音频，即可生成人脸高度一致、音色精准复...

InteractAvatar是一款开源的文本驱动、场景感知、人物-物体交互可控的说话数字人（Talking Avatar）生成框架，核心解决当前数字人生成领域长期存在的控制-质量两难问题——...

PersonaLive是一款面向实时数字人交互场景的开源AI框架，核心定位是“低门槛、高性能的实时人像动画生成工具”，由澳门大学、dzine.ai与大湾区大学GVC实验室联合研发并开源...

数字人新闻、工具、教程及资源推荐