SoulX-Podcast:Soul开源的多轮对话 TTS 工具,实现播客级语音生成与跨方言克隆
SoulX-Podcast 是由 Soul 开源的语音生成项目,聚焦播客风格的多轮、多说话人对话语音合成,同时兼容传统独白式 TTS 任务。该项目支持普通话、英语及四川话、河南话、粤语等...
SoulX-Podcast 是由 Soul 开源的语音生成项目,聚焦播客风格的多轮、多说话人对话语音合成,同时兼容传统独白式 TTS 任务。该项目支持普通话、英语及四川话、河南话、粤语等...
UntitledPen 是一款基于先进人工智能技术打造的多模态内容创作平台,专注于将文字转化为高度拟人化、自然流畅的语音内容。该平台融合了当前最先进的GPT模型与音频生成技术,...
MiMo-Audio是小米公司开发并开源的音频语言模型项目,旨在通过大规模预训练和创新的模型架构,实现音频领域的少样本学习能力。该项目依托超过1亿小时的多语言、多场景音频数...