OmniVoice Studio:开源本地化 AI 语音工具集,完全替代 ElevenLabs 的免费方案
OmniVoice Studio 是一个完全开源、本地运行的 AI 语音工具集,定位为 ElevenLabs 的替代品。它支持 646 种语言的零样本语音克隆、语音设计(多参数调节)、全流程视频配音...
OmniVoice Studio 是一个完全开源、本地运行的 AI 语音工具集,定位为 ElevenLabs 的替代品。它支持 646 种语言的零样本语音克隆、语音设计(多参数调节)、全流程视频配音...
Inworld Realtime TTS-2 是由 Inworld AI 官方推出的第二代实时语音合成模型,专为真人实时多轮对话场景深度定制,区别于传统面向有声书、旁白播报的通用TTS产品。
Voicebox是一款开源本地优先AI语音合成工具,主打隐私安全、全功能语音创作与跨平台高性能运行。作为免费的 ElevenLabs 开源替代方案,它支持零样本语音克隆、7款TTS引擎、...
OmniVoice是k2-fsa团队(小米Kaldi团队)开源的超大规模多语言零样本文本转语音(TTS)系统,基于创新单阶段离散非自回归扩散语言模型架构,支持646种语言的高质量语音生成...
LongCat-AudioDiT是美团LongCat开源的基于扩散模型的高保真文本转语音(TTS)与零样本语音克隆模型,是当前语音合成领域的SOTA(State-of-the-Art)方案之一。该模型彻底革...
SonificaLabs是一个基于人工智能技术的专业音频内容生产平台。该平台的核心功能是,用户通过输入自然语言描述,即可在无需任何录音设备或专业音频制作技能的情况下,生成适...
AnySpeech是一个面向全球内容创作者的专业AI文本转语音(Text-to-Speech, TTS)平台。该平台的核心功能是将用户输入的文字内容,通过人工智能技术,转换为高质量、自然逼真...
SenseAudio是商汤科技推出的一站式AI语音与音视频创作平台。它集成了语音识别、语音合成、音色克隆、人声提取等核心技术,旨在为用户提供从语音生成、编辑到交互的完整解决...
Voiceslab是一个AI语音克隆平台,允许用户快速创建自己声音的高保真复制品。用户只需通过朗读一段简短的脚本,即可生成与本人声音高度相似的AI克隆,并利用该克隆声音生成语...
Vois是一款专业的桌面端AI语音工作室,旨在为内容创作者提供从文本脚本到成品音频的一站式、全流程解决方案。它并非简单的在线文本转语音(TTS)工具,而是一个集成了脚本编...
Dangcingai是一个基于人工智能技术的在线自动配音工具,其核心功能在于允许用户通过粘贴视频URL链接的方式,快速、便捷地为视频内容生成新的AI配音,实现“即贴即出片”的高...
VMEG AI是一家面向全球内容创作者与企业级用户的端到端AI音视频本地化平台,它并非传统字幕工具或简单TTS合成器,而是融合大语言模型(LLM)+ 语音合成(TTS/Voice Cloning...
AudioPod AI 是一个基于人工智能技术的多功能音频工具平台,集成了语音克隆、AI音乐生成、语音转文字、人声分离、降噪处理、多语言文本转语音(TTS)等核心功能。所有操作均...
Kani TTS是由nineninesix-ai团队开发并开源的轻量级高性能文本转语音(Text-to-Speech,TTS)框架,旨在为开发者和企业提供快速、高效、类人化的语音生成解决方案。该项目基...
GoCrazyAI 是一个基于前沿人工智能技术的多模态内容生成平台,致力于帮助用户在几秒钟内创建高质量、高创意的数字内容。该平台融合了当前最先进的生成式AI模型,涵盖AI视频...