语音克隆

Makefun：一站式AI图像与视频生成工具，永久免费无水印

Makefun是一款免费无上限、隐私优先、全功能集成的一站式AI视频与图像创作平台，无需信用卡即可注册使用，集成阿里Wan 2.6、Veo 3.1、Flux Kontext等行业顶尖模型，覆盖文生...

4周前 AI视频生成

125

MOSS-TTS-Nano：轻量级多语言零样本TTS模型，CPU实时语音合成

MOSS-TTS-Nano 是由 OpenMOSS 团队开源的一款超轻量级多语言文本转语音（TTS）模型，依托 MOSS 大模型生态构建，主打小体积、低延迟、低硬件门槛与高音质输出，是面向端侧设...

2个月前 AI新闻

169

Listnr AI：支持142种语言与1000种声音的AI语音生成与文本转语音平台

Listnr AI是一款基于生成式人工智能技术的在线文本转语音（Text-to-Speech）与语音生成平台。该平台的核心功能是将用户输入的文字内容，转换为高度拟人化、自然流畅的语音音...

2个月前 AI音频制作

91

LongCat-AudioDiT：美团开源的高保真零样本语音克隆与文本转语音模型

LongCat-AudioDiT是美团LongCat开源的基于扩散模型的高保真文本转语音（TTS）与零样本语音克隆模型，是当前语音合成领域的SOTA（State-of-the-Art）方案之一。该模型彻底革...

2个月前 AI新闻

157

KokoClone：开源快速语音克隆工具，支持文本生成与音频转换双模式

KokoClone是依托Kokoro-ONNX快速神经TTS引擎与Kanade语音转换架构打造的开源实时多语种语音克隆系统，具备文本克隆、音频克隆两大核心能力，仅需3-10秒参考音频即可实现零样...

3个月前 AI新闻

174

AnySpeech ：支持100+种声音与50+种语言的AI文本转语音工具

AnySpeech是一个面向全球内容创作者的专业AI文本转语音（Text-to-Speech, TTS）平台。该平台的核心功能是将用户输入的文字内容，通过人工智能技术，转换为高质量、自然逼真...

2个月前 AI音频制作

149

JoyPix AI：一站式AI数字人与视频生成平台

JoyPix AI是一个集成了多种前沿人工智能技术的视频生成与创作平台，专注于通过AI驱动的数字人、口型同步以及多种顶尖视频模型，降低专业内容创作的门槛。使用户无需具备复杂...

2个月前 AI视频生成

214

Vois：本地化桌面AI语音生成工具，脚本到成品全搞定

Vois是一款专业的桌面端AI语音工作室，旨在为内容创作者提供从文本脚本到成品音频的一站式、全流程解决方案。它并非简单的在线文本转语音（TTS）工具，而是一个集成了脚本编...

3个月前 AI音频制作

160

FineVoice：一站式AI语音生成与视频配音平台，30秒快速复制任何声音

FineVoice是一款多功能、一体化的AI语音生成与视频配音平台。它旨在通过先进的人工智能技术，为用户提供从文本到语音、语音克隆、变声、音效生成到视频配音的全套音频解决方...

3个月前 AI音频制作

130

MLX-Audio：面向Apple Silicon的开源本地AI语音文字互转与语音转换工具

MLX-Audio是基于苹果MLX框架深度开发、专为Apple Silicon M系列芯片优化的开源音频处理库，完整覆盖文本转语音、语音转文本、语音转语音三大核心能力，支持多语言、多主流模...

4个月前 AI新闻

305

Qwen3-TTS：通义千问开源的AI语音合成模型，实现多语种语音生成与定制化音色创作

Qwen3-TTS是通义千问开源的一站式多语言语音生成模型全家桶，基于自研Qwen3大模型体系构建，采用离散多码本LM架构与Dual-Track双轨流式生成技术，实现语音克隆、语音设计、...

5个月前 AI新闻

457

VoiceSculptor：开源语音定制合成框架，自然语言指令驱动的音色设计与语音克隆工具

VoiceSculptor 是由西北工业大学音频语音与语言处理研究组主导开发并开源的语音智能处理类开源项目，是一款专注于「自然语言可控的语音定制与语音合成」的全链路工具框架，...

5个月前 AI新闻

216

Voicemaker：AI驱动的语音生成与音频增强一体化平台

Voicemaker 是一款基于人工智能技术打造的多功能语音生成与处理平台，专注于为用户提供从文本转语音（Text-to-Speech, TTS）、语音到语音转换（Speech-to-Speech）、语音克...

5个月前 AI音频制作

203

Chatterbox：开源的高性能TTS模型，支持23种语言零样本克隆与情感语音合成

Chatterbox是由Resemble AI团队打造的一款开源生产级文本转语音（TTS）模型家族，并非单一模型，而是三款针对性优化的先进TTS模型组合，整体以轻量化架构实现了媲美商业闭源...

6个月前 AI新闻

142

Step-Audio-EditX：阶跃星辰推出的开源AI音频编辑工具，支持零样本TTS与多维度语音特征定制

Step-Audio-EditX是阶跃星辰推出的一款开源音频编辑工具，基于 30 亿参数的大语言模型（LLM）构建，专注于提供富有表现力和迭代式的音频编辑体验。该工具不仅支持普通话、英...

7个月前 AI新闻

75

语音克隆新闻、工具、教程及资源推荐