Voicebox:开源本地AI语音合成工具,本地运行零样本语音克隆与多轨编辑
Voicebox是一款开源本地优先AI语音合成工具,主打隐私安全、全功能语音创作与跨平台高性能运行。作为免费的 ElevenLabs 开源替代方案,它支持零样本语音克隆、7款TTS引擎、...
Voicebox是一款开源本地优先AI语音合成工具,主打隐私安全、全功能语音创作与跨平台高性能运行。作为免费的 ElevenLabs 开源替代方案,它支持零样本语音克隆、7款TTS引擎、...
OmniVoice是k2-fsa团队(小米Kaldi团队)开源的超大规模多语言零样本文本转语音(TTS)系统,基于创新单阶段离散非自回归扩散语言模型架构,支持646种语言的高质量语音生成...
Voiceslab是一个AI语音克隆平台,允许用户快速创建自己声音的高保真复制品。用户只需通过朗读一段简短的脚本,即可生成与本人声音高度相似的AI克隆,并利用该克隆声音生成语...
A2E AI是全球首个真正实现“免费无限制+隐私优先”的全链路AI视频创作平台,以“让每个人都能轻松制作专业级视频”为使命,整合文本、图像、语音、视频多模态AI能力,提供从...
Rask AI 是一款基于人工智能技术的多语言音视频翻译与配音平台,专注于帮助企业、内容创作者及教育机构突破语言壁垒,实现全球化传播。平台通过AI语音克隆、口型同步、多说...
Voice-Pro是一款基于Python开发的AI驱动型语音处理网页应用,集成Whisper、F5-TTS、Demucs等主流模型,提供语音识别、零样本语音克隆、多语言文本转语音、音频分离、YouTub...
VMEG AI是一家面向全球内容创作者与企业级用户的端到端AI音视频本地化平台,它并非传统字幕工具或简单TTS合成器,而是融合大语言模型(LLM)+ 语音合成(TTS/Voice Cloning...
AudioPod AI 是一个基于人工智能技术的多功能音频工具平台,集成了语音克隆、AI音乐生成、语音转文字、人声分离、降噪处理、多语言文本转语音(TTS)等核心功能。所有操作均...
Vidnoz AI 是一款集 AI虚拟人生成、文本转语音、多语言视频翻译、AI视频合成与定制化数字人克隆 于一体的在线智能视频创作工具。它通过先进的深度学习算法和自然语言处理技...
Fanfun AI 是一款基于生成式人工智能技术的创新语音克隆与AI视频内容创作平台。它允许用户通过简单的操作,快速克隆全球知名人物的独特声音,如科比、Snoop Dogg、迈克尔·...
CosyVoice是由阿里通义实验室打造的开源TTS项目,其核心定位是面向“野外”真实场景的高质量、高灵活性语音合成框架。作为基于LLM架构的TTS工具,CosyVoice不仅支持基础的文...
LuoGen-agent 是 LuoGen-AI 团队开源的商业级爆款视频自动化生成智能体,集成智能文案处理、高保真语音克隆、数字人口播合成、多平台自动发布等全流程能力,基于 Whisper、...
海豚AI(TTS Online)是一款基于人工智能技术的在线文本转语音(Text-to-Speech, TTS)服务平台,专注于为用户提供高效、自然、富有情感表现力的语音合成解决方案。该平台融...
LOVO AI是一款聚焦“高真实感、强可操作性、全场景适配”的免费AI语音生成器(AI Voice Generator)与文本转语音(Text to Speech, TTS)工具,核心目标是通过AI技术降低音...
Voicebox是一款开源的AI语音合成软件。它是一个本地优先的语音克隆工作室,可在macOS、Windows系统上运行,Linux版本也在开发中。其核心定位是帮助用户完成语音克隆、自然语...