VibeVoice:微软开源的 AI 语音合成工具,实现低延迟长音频与多语种语音生成
VibeVoice是微软开源的一款高性能语音AI研究框架,聚焦于解决传统文本转语音(TTS)系统在长文本处理、多说话人一致性及自然对话生成方面的技术痛点。该框架支持最长90分钟...
VibeVoice是微软开源的一款高性能语音AI研究框架,聚焦于解决传统文本转语音(TTS)系统在长文本处理、多说话人一致性及自然对话生成方面的技术痛点。该框架支持最长90分钟...
CosyVoice是由阿里通义实验室打造的开源TTS项目,其核心定位是面向“野外”真实场景的高质量、高灵活性语音合成框架。作为基于LLM架构的TTS工具,CosyVoice不仅支持基础的文...
EasyVoice是一款免费开源的智能文本转语音解决方案,专注于解决超长文本转换、多角色配音等核心需求,支持10万字以上小说一键转为有声书,具备流式传输、自动字幕生成、多语...
Supertonic是一款开源的文本转语音(TTS)系统,由韩国科技公司Supertone Inc.研发并开源,核心目标是解决传统TTS系统“依赖云服务、延迟高、隐私风险、资源占用大”等痛点...
SPEECHMA 是一个面向全球用户的免费、高质量、支持商业用途的文本转语音(Text-to-Speech, TTS)平台。它致力于打破语音技术的使用壁垒,将先进的AI语音合成能力开放给个人...
Luvvoice 是一款基于深度学习与人工智能技术的先进文本转语音TTS在线工具,致力于为全球用户提供高质量、自然流畅的人工智能语音生成服务。它不仅支持超过70种语言和200种A...
知意配音是一款基于人工智能技术打造的在线文字转语音服务平台,致力于为用户提供高质量、多语种、多音色的语音合成服务。该平台通过先进的深度学习算法与自然语言处理技术...
ebook2audiobook是一款开源的电子书转有声书工具,核心功能是将非DRM合法电子书转换为带章节结构与元数据的有声书。工具支持1110+种语言,集成XTTSv2、Bark、Vits等主流TTS...
SoulX-Podcast 是由 Soul 开源的语音生成项目,聚焦播客风格的多轮、多说话人对话语音合成,同时兼容传统独白式 TTS 任务。该项目支持普通话、英语及四川话、河南话、粤语等...
Orpheus TTS是由Canopy AI开发的开源文本到语音(TTS)系统,以Llama-3b大型语言模型(LLM)为骨干,突破性地将LLM能力应用于语音合成领域。该项目支持零样本语音克隆、可控...
Fish Speech(后更名OpenAudio)是由fishaudio团队开发的开源文本转语音(TTS)解决方案,核心基于OpenAudio-S1系列模型,提供高质量语音合成、跨语言语音克隆、情感语气控...
音秘(AudioMyst)是由百度公司推出的一款基于人工智能技术的免费在线播客内容创作与生成平台,致力于为创作者提供从文本到音频的一站式智能解决方案。该平台融合了百度领先的...
DiaMoE-TTS 是由巨人网络联合清华大学开发的开源多方言文本到语音(TTS)框架,该框架基于 F5-TTS 架构扩展,通过统一国际音标(IPA)前端实现跨方言语音表示标准化,结合混...
TTS Omni是一款基于先进大语言模型(LLM)技术的人工智能文字转语音(TTS)生成器,致力于为用户提供高质量、高拟真度、多语言、多情感表达的语音合成服务。作为目前市场上...
Real-Time-Voice-Cloning 是一个基于深度学习的开源语音克隆框架,能够通过几秒钟的音频样本克隆说话人的声音,并基于任意文本生成该说话人的语音。该项目实现了 SV2TTS架构...