AI语音合成

MAI-Voice-2-Flash：微软推出的低延迟高并发企业级实时语音合成TTS模型

MAI-Voice-2-Flash是微软于2026年7月官方发布、基于自研MAI语音基座训练的极速低延迟文本转语音（TTS）模型，隶属于微软MAI语音模型家族，依托Azure AI Foundry与Azure语音...

4天前 AI新闻

74

Qwen-Audio-3.0-TTS：阿里通义千问推出的工业化语音合成模型

Qwen-Audio-3.0-TTS 是阿里巴巴 Token Foundry 团队研发的工业化高质量语音合成模型，归属通义千问音频系列。模型面向真实生产场景打造，主打高保真音色克隆、多语种与汉语...

1周前 AI新闻

77

Confucius4-TTS：网易有道开源的多语种TTS语音合成引擎

Confucius4-TTS是网易有道推出基于LLM架构的开源跨语种零样本语音合成引擎，支持14种语言免参考文本音色克隆、无口音跨语种语音迁移、音频情感同步复刻，提供在线Gradio演示...

1个月前 AI新闻

97

VoiceCanvas：在线多语言AI文本转语音与语音克隆配音工具

VoiceCanvas是网页端一站式AI TTS平台，支持50+语种文本转语音、10秒人声克隆、AI自定义音色、故事多角色配音与自动播客生成，免费试用，支持微信支付宝，适配自媒体、教育...

4周前 AI音频制作

113

OmniVoice Studio：开源本地化 AI 语音工具集，完全替代 ElevenLabs 的免费方案

OmniVoice Studio 是一个完全开源、本地运行的 AI 语音工具集，定位为 ElevenLabs 的替代品。它支持 646 种语言的零样本语音克隆、语音设计（多参数调节）、全流程视频配音...

1个月前 AI新闻

144

Realtime TTS-2：Inworld推出的AI实时对话语音合成模型，低延迟情绪自适应多语言TTS

Inworld Realtime TTS-2 是由 Inworld AI 官方推出的第二代实时语音合成模型，专为真人实时多轮对话场景深度定制，区别于传统面向有声书、旁白播报的通用TTS产品。

2个月前 AI新闻

160

Voicebox：开源本地AI语音合成工具，本地运行零样本语音克隆与多轨编辑

Voicebox是一款开源本地优先AI语音合成工具，主打隐私安全、全功能语音创作与跨平台高性能运行。作为免费的 ElevenLabs 开源替代方案，它支持零样本语音克隆、7款TTS引擎、...

3个月前 AI新闻

451

OmniVoice：小米开源的646种语言零样本文本转语音（TTS）系统

OmniVoice是k2-fsa团队（小米Kaldi团队）开源的超大规模多语言零样本文本转语音（TTS）系统，基于创新单阶段离散非自回归扩散语言模型架构，支持646种语言的高质量语音生成...

3个月前 AI新闻

1159

LongCat-AudioDiT：美团开源的高保真零样本语音克隆与文本转语音模型

LongCat-AudioDiT是美团LongCat开源的基于扩散模型的高保真文本转语音（TTS）与零样本语音克隆模型，是当前语音合成领域的SOTA（State-of-the-Art）方案之一。该模型彻底革...

3个月前 AI新闻

178

SonificaLabs：AI音频生成平台，30秒将创意转化为专业播客/短视频音效

SonificaLabs是一个基于人工智能技术的专业音频内容生产平台。该平台的核心功能是，用户通过输入自然语言描述，即可在无需任何录音设备或专业音频制作技能的情况下，生成适...

4个月前 AI音频制作

133

AnySpeech ：支持100+种声音与50+种语言的AI文本转语音工具

AnySpeech是一个面向全球内容创作者的专业AI文本转语音（Text-to-Speech, TTS）平台。该平台的核心功能是将用户输入的文字内容，通过人工智能技术，转换为高质量、自然逼真...

4个月前 AI音频制作

155

SenseAudio：商汤科技推出的AI语音与音视频一站式创作平台

SenseAudio是商汤科技推出的一站式AI语音与音视频创作平台。它集成了语音识别、语音合成、音色克隆、人声提取等核心技术，旨在为用户提供从语音生成、编辑到交互的完整解决...

4个月前 AI音频制作

208

Voiceslab：支持12种以上语言的AI语音合成与克隆工具

Voiceslab是一个AI语音克隆平台，允许用户快速创建自己声音的高保真复制品。用户只需通过朗读一段简短的脚本，即可生成与本人声音高度相似的AI克隆，并利用该克隆声音生成语...

4个月前 AI音频制作

140

Vois：本地化桌面AI语音生成工具，脚本到成品全搞定

Vois是一款专业的桌面端AI语音工作室，旨在为内容创作者提供从文本脚本到成品音频的一站式、全流程解决方案。它并非简单的在线文本转语音（TTS）工具，而是一个集成了脚本编...

4个月前 AI音频制作

196

Dangcingai：AI自动配音在线工具，粘贴视频链接一键生成配音视频

Dangcingai是一个基于人工智能技术的在线自动配音工具，其核心功能在于允许用户通过粘贴视频URL链接的方式，快速、便捷地为视频内容生成新的AI配音，实现“即贴即出片”的高...

4个月前 AI音频制作

135

AI语音合成新闻、工具、教程及资源推荐

MAI-Voice-2-Flash：微软推出的低延迟高并发企业级实时语音合成TTS模型

Qwen-Audio-3.0-TTS：阿里通义千问推出的工业化语音合成模型

Confucius4-TTS：网易有道开源的多语种TTS语音合成引擎

VoiceCanvas：在线多语言AI文本转语音与语音克隆配音工具

OmniVoice Studio：开源本地化 AI 语音工具集，完全替代 ElevenLabs 的免费方案

Realtime TTS-2：Inworld推出的AI实时对话语音合成模型，低延迟情绪自适应多语言TTS

Voicebox：开源本地AI语音合成工具，本地运行零样本语音克隆与多轨编辑

OmniVoice：小米开源的646种语言零样本文本转语音（TTS）系统

LongCat-AudioDiT：美团开源的高保真零样本语音克隆与文本转语音模型

SonificaLabs：AI音频生成平台，30秒将创意转化为专业播客/短视频音效

AnySpeech ：支持100+种声音与50+种语言的AI文本转语音工具

SenseAudio：商汤科技推出的AI语音与音视频一站式创作平台

Voiceslab：支持12种以上语言的AI语音合成与克隆工具

Vois：本地化桌面AI语音生成工具，脚本到成品全搞定

Dangcingai：AI自动配音在线工具，粘贴视频链接一键生成配音视频