CosyVoice:阿里通义开源的多语言低延迟 TTS 框架,支持跨语言克隆与流式语音合成
CosyVoice是由阿里通义实验室打造的开源TTS项目,其核心定位是面向“野外”真实场景的高质量、高灵活性语音合成框架。作为基于LLM架构的TTS工具,CosyVoice不仅支持基础的文...
CosyVoice是由阿里通义实验室打造的开源TTS项目,其核心定位是面向“野外”真实场景的高质量、高灵活性语音合成框架。作为基于LLM架构的TTS工具,CosyVoice不仅支持基础的文...
Luvvoice 是一款基于深度学习与人工智能技术的先进文本转语音TTS在线工具,致力于为全球用户提供高质量、自然流畅的人工智能语音生成服务。它不仅支持超过70种语言和200种A...
SoulX-Podcast 是由 Soul 开源的语音生成项目,聚焦播客风格的多轮、多说话人对话语音合成,同时兼容传统独白式 TTS 任务。该项目支持普通话、英语及四川话、河南话、粤语等...
UntitledPen 是一款基于先进人工智能技术打造的多模态内容创作平台,专注于将文字转化为高度拟人化、自然流畅的语音内容。该平台融合了当前最先进的GPT模型与音频生成技术,...
MiMo-Audio是小米公司开发并开源的音频语言模型项目,旨在通过大规模预训练和创新的模型架构,实现音频领域的少样本学习能力。该项目依托超过1亿小时的多语言、多场景音频数...