Voice-Pro:轻量型开源语音工具集,集成识别、克隆与多语言配音
Voice-Pro是一款基于Python开发的AI驱动型语音处理网页应用,集成Whisper、F5-TTS、Demucs等主流模型,提供语音识别、零样本语音克隆、多语言文本转语音、音频分离、YouTub...
Voice-Pro是一款基于Python开发的AI驱动型语音处理网页应用,集成Whisper、F5-TTS、Demucs等主流模型,提供语音识别、零样本语音克隆、多语言文本转语音、音频分离、YouTub...
SAM-Audio是Meta研究院推出一款能够通过多模态提示实现通用音频分离的开源基础模型。SAM-Audio的核心理念是“提示即指令”,用户无需编写复杂的代码或调整繁琐的参数,只需...
Levelr 是一款基于人工智能技术的在线音频处理平台,致力于为全球内容创作者、播客制作者、媒体从业者及企业用户提供高效、智能的音频优化解决方案。该平台通过先进的深度学...