文字生成音频

AudioFly是由科大讯飞开源的文本驱动音频生成模型，基于Latent Diffusion Model架构构建，具备10亿参数规模。该模型可依据文本描述合成采样率为44.1kHz的高质量音效，在单事...

9个月前 AI新闻

103

文字生成音频新闻、工具、教程及资源推荐