DiaMoE-TTS:巨人网络联合清华大学开源的跨方言语音合成框架,支持 11 种方言与多语言兼容
DiaMoE-TTS 是由巨人网络联合清华大学开发的开源多方言文本到语音(TTS)框架,该框架基于 F5-TTS 架构扩展,通过统一国际音标(IPA)前端实现跨方言语音表示标准化,结合混...
DiaMoE-TTS 是由巨人网络联合清华大学开发的开源多方言文本到语音(TTS)框架,该框架基于 F5-TTS 架构扩展,通过统一国际音标(IPA)前端实现跨方言语音表示标准化,结合混...
TTS Omni是一款基于先进大语言模型(LLM)技术的人工智能文字转语音(TTS)生成器,致力于为用户提供高质量、高拟真度、多语言、多情感表达的语音合成服务。作为目前市场上...
Real-Time-Voice-Cloning 是一个基于深度学习的开源语音克隆框架,能够通过几秒钟的音频样本克隆说话人的声音,并基于任意文本生成该说话人的语音。该项目实现了 SV2TTS架构...
NeuTTS Air 是一个开源文本转语音项目,专注于设备端部署和即时语音克隆功能。它采用先进的 LM+codec 架构,在保持轻量级和高效率的同时,提供高质量、超写实的语音合成。仅...
AudioTextHub 是一款集先进人工智能技术于一体的免费在线文本转语音(TTS)平台,致力于为用户提供高度自然、富有表现力且可定制化的语音合成服务。作为行业内首个引入“AI...
FireRedChat是一个完全自托管的全双工语音交互解决方案,旨在帮助开发者构建实时语音AI代理。该系统整合了强大的TTS、ASR、pVAD和EoT功能,使开发者能够创建可定制、注重隐...
NiceVoice 是一款基于先进人工智能技术开发的在线声音克隆服务平台,通过深度学习和声纹建模技术,NiceVoice 能够仅凭用户提供的简短语音样本(5–30秒),快速生成高度还原...
LOVO AI是一款聚焦“高真实感、强可操作性、全场景适配”的免费AI语音生成器(AI Voice Generator)与文本转语音(Text to Speech, TTS)工具,核心目标是通过AI技术降低音...
Spark-TTS 是一个基于大语言模型(LLM)架构的高效文本到语音(TTS)系统,由 SparkAudio 团队开发并开源。该项目最大的特点是不依赖额外的声码器,直接通过 LLM 预测语音的...
MeloTTS 是由 MyShell AI 开发的开源文本转语音(TTS)项目,基于先进的深度学习技术,提供高质量、多语言的语音合成能力。该项目支持英语、中文、日语、韩语等多种语言,可...
VoxCPM是一款创新型无分词器文本转语音(TTS)系统。该系统采用端到端的扩散自回归架构,能够直接从文本生成连续的语音表示,彻底摆脱了传统TTS系统中离散分词的限制,重新...
FireRedTTS-2是一款开源的文本转语音(TTS)系统,专注于多角色对话场景下的长格式语音生成。该系统采用先进的深度学习架构,能够生成自然流畅的语音,同时支持多个说话人之...
IndexTTS2是B站开源的新一代自回归文本到语音(TTS)模型,是IndexTTS系列的最新迭代版本,专注于解决情感表达精准控制与语音时长灵活调节的核心痛点。作为工业级TTS解决方...
ZipVoice是一款基于流匹配技术的零样本语音合成TTS模型,核心定位是在保证高质量语音输出的同时,实现轻量化模型架构与快速推理性能的平衡。支持通过少量参考语音(提示音频...
TTSMaker,中文名称为“马克配音”,是一款功能强大、操作简便的在线文字转语音(TTS)服务工具。它基于先进的语音合成技术,能够将用户输入的文本内容转换为自然、流畅的语...