Fish Speech:开源文本转语音解决方案,支持高质量语音合成与跨语言语音克隆
Fish Speech(后更名OpenAudio)是由fishaudio团队开发的开源文本转语音(TTS)解决方案,核心基于OpenAudio-S1系列模型,提供高质量语音合成、跨语言语音克隆、情感语气控...
Fish Speech(后更名OpenAudio)是由fishaudio团队开发的开源文本转语音(TTS)解决方案,核心基于OpenAudio-S1系列模型,提供高质量语音合成、跨语言语音克隆、情感语气控...
音秘(AudioMyst)是由百度公司推出的一款基于人工智能技术的免费在线播客内容创作与生成平台,致力于为创作者提供从文本到音频的一站式智能解决方案。该平台融合了百度领先的...
Local-NotebookLM 是一款开源的本地 AI 工具,核心功能是将 PDF 文档转换为播客、摘要、访谈等多种风格的音频内容。该工具无需依赖云端服务,可通过本地部署的 LLM(如 Oll...
DiaMoE-TTS 是由巨人网络联合清华大学开发的开源多方言文本到语音(TTS)框架,该框架基于 F5-TTS 架构扩展,通过统一国际音标(IPA)前端实现跨方言语音表示标准化,结合混...
NeuTTS Air 是一个开源文本转语音项目,专注于设备端部署和即时语音克隆功能。它采用先进的 LM+codec 架构,在保持轻量级和高效率的同时,提供高质量、超写实的语音合成。仅...
AudioTextHub 是一款集先进人工智能技术于一体的免费在线文本转语音(TTS)平台,致力于为用户提供高度自然、富有表现力且可定制化的语音合成服务。作为行业内首个引入“AI...
音子AI是一款基于先进AI技术的在线音视频处理服务平台,专注于为用户提供高效、精准、便捷的音频内容分离与转换服务。致力于帮助用户快速从音频或视频文件中提取所需内容,...
LOVO AI是一款聚焦“高真实感、强可操作性、全场景适配”的免费AI语音生成器(AI Voice Generator)与文本转语音(Text to Speech, TTS)工具,核心目标是通过AI技术降低音...
MeloTTS 是由 MyShell AI 开发的开源文本转语音(TTS)项目,基于先进的深度学习技术,提供高质量、多语言的语音合成能力。该项目支持英语、中文、日语、韩语等多种语言,可...
VoxCPM是一款创新型无分词器文本转语音(TTS)系统。该系统采用端到端的扩散自回归架构,能够直接从文本生成连续的语音表示,彻底摆脱了传统TTS系统中离散分词的限制,重新...
FireRedTTS-2是一款开源的文本转语音(TTS)系统,专注于多角色对话场景下的长格式语音生成。该系统采用先进的深度学习架构,能够生成自然流畅的语音,同时支持多个说话人之...