MuseTalk:腾讯音乐开源的AI音频驱动唇形同步生成模型 MuseTalk是腾讯音乐娱乐集团Lyra Lab开源的实时高保真音频驱动唇形同步模型,基于latent空间修复技术,支持中文/英文/日语等多语言音频输入,可对256×256人脸区域精准唇形... 1个月前 AI新闻 284
LiveAvatar:开源实时流式虚拟人视频生成框架,支持无限长度交互式生成 LiveAvatar是一款专注于实时、流式、无限长度交互式虚拟人视频生成的开源框架,由阿里巴巴、中科大、北邮及浙大联合开源。该框架突破了传统虚拟人视频生成“长度有限、延迟... 5个月前 AI新闻 187