AudioFly:科大讯飞开源的高性能文本到音频生成模型 AudioFly是由科大讯飞开源的文本驱动音频生成模型,基于Latent Diffusion Model架构构建,具备10亿参数规模。该模型可依据文本描述合成采样率为44.1kHz的高质量音效,在单事... 3小时前 AI新闻 6