Voicebox:开源本地AI语音合成工具,本地运行零样本语音克隆与多轨编辑
Voicebox是一款开源本地优先AI语音合成工具,主打隐私安全、全功能语音创作与跨平台高性能运行。作为免费的 ElevenLabs 开源替代方案,它支持零样本语音克隆、7款TTS引擎、...
Voicebox是一款开源本地优先AI语音合成工具,主打隐私安全、全功能语音创作与跨平台高性能运行。作为免费的 ElevenLabs 开源替代方案,它支持零样本语音克隆、7款TTS引擎、...
OmniVoice是k2-fsa团队(小米Kaldi团队)开源的超大规模多语言零样本文本转语音(TTS)系统,基于创新单阶段离散非自回归扩散语言模型架构,支持646种语言的高质量语音生成...
LongCat-AudioDiT是美团LongCat开源的基于扩散模型的高保真文本转语音(TTS)与零样本语音克隆模型,是当前语音合成领域的SOTA(State-of-the-Art)方案之一。该模型彻底革...
SonificaLabs是一个基于人工智能技术的专业音频内容生产平台。该平台的核心功能是,用户通过输入自然语言描述,即可在无需任何录音设备或专业音频制作技能的情况下,生成适...
AnySpeech是一个面向全球内容创作者的专业AI文本转语音(Text-to-Speech, TTS)平台。该平台的核心功能是将用户输入的文字内容,通过人工智能技术,转换为高质量、自然逼真...
SenseAudio是商汤科技推出的一站式AI语音与音视频创作平台。它集成了语音识别、语音合成、音色克隆、人声提取等核心技术,旨在为用户提供从语音生成、编辑到交互的完整解决...
Voiceslab是一个AI语音克隆平台,允许用户快速创建自己声音的高保真复制品。用户只需通过朗读一段简短的脚本,即可生成与本人声音高度相似的AI克隆,并利用该克隆声音生成语...
Vois是一款专业的桌面端AI语音工作室,旨在为内容创作者提供从文本脚本到成品音频的一站式、全流程解决方案。它并非简单的在线文本转语音(TTS)工具,而是一个集成了脚本编...
Dangcingai是一个基于人工智能技术的在线自动配音工具,其核心功能在于允许用户通过粘贴视频URL链接的方式,快速、便捷地为视频内容生成新的AI配音,实现“即贴即出片”的高...
VMEG AI是一家面向全球内容创作者与企业级用户的端到端AI音视频本地化平台,它并非传统字幕工具或简单TTS合成器,而是融合大语言模型(LLM)+ 语音合成(TTS/Voice Cloning...
AudioPod AI 是一个基于人工智能技术的多功能音频工具平台,集成了语音克隆、AI音乐生成、语音转文字、人声分离、降噪处理、多语言文本转语音(TTS)等核心功能。所有操作均...
Kani TTS是由nineninesix-ai团队开发并开源的轻量级高性能文本转语音(Text-to-Speech,TTS)框架,旨在为开发者和企业提供快速、高效、类人化的语音生成解决方案。该项目基...
GoCrazyAI 是一个基于前沿人工智能技术的多模态内容生成平台,致力于帮助用户在几秒钟内创建高质量、高创意的数字内容。该平台融合了当前最先进的生成式AI模型,涵盖AI视频...
Fliki AI 是一款基于人工智能技术打造的全栈式内容创作平台,专注于将文字一键转化为专业级视频和自然流畅的语音内容。它融合了先进的“文本转语音”(Text-to-Speech, TTS...
VoiceNovel 是一款基于先进人工智能技术的在线语音小说创作与转换平台,通过深度学习驱动的神经语音合成系统,VoiceNovel 能够将用户上传的小说文本自动分析、分章处理,并...