Maya1:开源高拟真 TTS 系统,支持情感控制与流式音频生成 Maya1-Text-to-Speech(以下简称Maya1)是一款基于深度学习构建的开源文本转语音(TTS)系统,主打高拟真语音生成、精细化情感控制与低延迟流式音频输出能力。该项目支持通... 3周前 AI新闻 77
AudioGPT:开源多模态音频处理工具,一站式实现语音、音乐、声音生成与理解 AudioGPT是由AIGC-Audio团队开源的多模态音频智能处理项目,其核心定位是“音频领域的全栈式解决方案”——通过整合业界成熟的基础模型,实现对语音、音乐、通用声音的“理... 1个月前 AI新闻 52