OmniVoice Studio:开源本地化 AI 语音工具集,完全替代 ElevenLabs 的免费方案
OmniVoice Studio 是一个完全开源、本地运行的 AI 语音工具集,定位为 ElevenLabs 的替代品。它支持 646 种语言的零样本语音克隆、语音设计(多参数调节)、全流程视频配音...
OmniVoice Studio 是一个完全开源、本地运行的 AI 语音工具集,定位为 ElevenLabs 的替代品。它支持 646 种语言的零样本语音克隆、语音设计(多参数调节)、全流程视频配音...
Voicebox是一款开源本地优先AI语音合成工具,主打隐私安全、全功能语音创作与跨平台高性能运行。作为免费的 ElevenLabs 开源替代方案,它支持零样本语音克隆、7款TTS引擎、...
Lalals是集成AI人声处理、音乐生成、音轨分离与音频修复功能的一站式专业级音频创作平台,依托自研Bluewaters AI算法,提供1000+AI音色、AI语音克隆、文本生成歌曲、23+音轨...
OmniVoice是k2-fsa团队(小米Kaldi团队)开源的超大规模多语言零样本文本转语音(TTS)系统,基于创新单阶段离散非自回归扩散语言模型架构,支持646种语言的高质量语音生成...
Voiceslab是一个AI语音克隆平台,允许用户快速创建自己声音的高保真复制品。用户只需通过朗读一段简短的脚本,即可生成与本人声音高度相似的AI克隆,并利用该克隆声音生成语...
A2E AI是全球首个真正实现“免费无限制+隐私优先”的全链路AI视频创作平台,以“让每个人都能轻松制作专业级视频”为使命,整合文本、图像、语音、视频多模态AI能力,提供从...
Rask AI 是一款基于人工智能技术的多语言音视频翻译与配音平台,专注于帮助企业、内容创作者及教育机构突破语言壁垒,实现全球化传播。平台通过AI语音克隆、口型同步、多说...
Voice-Pro是一款基于Python开发的AI驱动型语音处理网页应用,集成Whisper、F5-TTS、Demucs等主流模型,提供语音识别、零样本语音克隆、多语言文本转语音、音频分离、YouTub...
VMEG AI是一家面向全球内容创作者与企业级用户的端到端AI音视频本地化平台,它并非传统字幕工具或简单TTS合成器,而是融合大语言模型(LLM)+ 语音合成(TTS/Voice Cloning...
AudioPod AI 是一个基于人工智能技术的多功能音频工具平台,集成了语音克隆、AI音乐生成、语音转文字、人声分离、降噪处理、多语言文本转语音(TTS)等核心功能。所有操作均...
Vidnoz AI 是一款集 AI虚拟人生成、文本转语音、多语言视频翻译、AI视频合成与定制化数字人克隆 于一体的在线智能视频创作工具。它通过先进的深度学习算法和自然语言处理技...
Fanfun AI 是一款基于生成式人工智能技术的创新语音克隆与AI视频内容创作平台。它允许用户通过简单的操作,快速克隆全球知名人物的独特声音,如科比、Snoop Dogg、迈克尔·...
CosyVoice是由阿里通义实验室打造的开源TTS项目,其核心定位是面向“野外”真实场景的高质量、高灵活性语音合成框架。作为基于LLM架构的TTS工具,CosyVoice不仅支持基础的文...
LuoGen-agent 是 LuoGen-AI 团队开源的商业级爆款视频自动化生成智能体,集成智能文案处理、高保真语音克隆、数字人口播合成、多平台自动发布等全流程能力,基于 Whisper、...
海豚AI(TTS Online)是一款基于人工智能技术的在线文本转语音(Text-to-Speech, TTS)服务平台,专注于为用户提供高效、自然、富有情感表现力的语音合成解决方案。该平台融...