tts

Qwen3-TTS：通义千问开源的AI语音合成模型，实现多语种语音生成与定制化音色创作

Qwen3-TTS是通义千问开源的一站式多语言语音生成模型全家桶，基于自研Qwen3大模型体系构建，采用离散多码本LM架构与Dual-Track双轨流式生成技术，实现语音克隆、语音设计、...

6个月前 AI新闻

524

FlowSpeech：支持70+语言的专业AI语音生成器，打造逼真人声TTS配音

FlowSpeech是一款先进的AI语音生成器，致力于提供接近真人的专业TTS配音服务。通过深度理解上下文并支持停顿与情绪控制，FlowSpeech能够生成高度逼真的语音，适用于各种项目...

5个月前 AI音频制作

124

VoiceSculptor：开源语音定制合成框架，自然语言指令驱动的音色设计与语音克隆工具

VoiceSculptor 是由西北工业大学音频语音与语言处理研究组主导开发并开源的语音智能处理类开源项目，是一款专注于「自然语言可控的语音定制与语音合成」的全链路工具框架，...

6个月前 AI新闻

264

Voicemaker：AI驱动的语音生成与音频增强一体化平台

Voicemaker 是一款基于人工智能技术打造的多功能语音生成与处理平台，专注于为用户提供从文本转语音（Text-to-Speech, TTS）、语音到语音转换（Speech-to-Speech）、语音克...

6个月前 AI音频制作

222

Chatterbox：开源的高性能TTS模型，支持23种语言零样本克隆与情感语音合成

Chatterbox是由Resemble AI团队打造的一款开源生产级文本转语音（TTS）模型家族，并非单一模型，而是三款针对性优化的先进TTS模型组合，整体以轻量化架构实现了媲美商业闭源...

7个月前 AI新闻

186

Kani TTS：轻量级高性能开源文本转语音(TTS)框架，支持多语言与跨硬件优化推理

Kani TTS是由nineninesix-ai团队开发并开源的轻量级高性能文本转语音（Text-to-Speech，TTS）框架，旨在为开发者和企业提供快速、高效、类人化的语音生成解决方案。该项目基...

7个月前 AI新闻

170

Maya1：开源高拟真 TTS 系统，支持情感控制与流式音频生成

Maya1-Text-to-Speech（以下简称Maya1）是一款基于深度学习构建的开源文本转语音（TTS）系统，主打高拟真语音生成、精细化情感控制与低延迟流式音频输出能力。该项目支持通...

7个月前 AI新闻

176

VoiceNovel：AI语音小说生成平台，一键将文字小说转为沉浸式有声读物

VoiceNovel 是一款基于先进人工智能技术的在线语音小说创作与转换平台，通过深度学习驱动的神经语音合成系统，VoiceNovel 能够将用户上传的小说文本自动分析、分章处理，并...

6个月前 AI音频制作

449

GLM-TTS：智谱 AI 推出的开源文本转语音（TTS）合成工具

GLM-TTS是由智谱AI团队开源的一款基于大语言模型（LLM）的高质量文本转语音（TTS）合成系统，其核心设计理念是将大语言模型的语义理解能力与语音合成技术相结合，突破传统T...

7个月前 AI新闻

282

VibeVoice：微软开源的 AI 语音合成工具，实现低延迟长音频与多语种语音生成

VibeVoice是微软开源的一款高性能语音AI研究框架，聚焦于解决传统文本转语音（TTS）系统在长文本处理、多说话人一致性及自然对话生成方面的技术痛点。该框架支持最长90分钟...

7个月前 AI新闻

163

CosyVoice：阿里通义开源的多语言低延迟 TTS 框架，支持跨语言克隆与流式语音合成

CosyVoice是由阿里通义实验室打造的开源TTS项目，其核心定位是面向“野外”真实场景的高质量、高灵活性语音合成框架。作为基于LLM架构的TTS工具，CosyVoice不仅支持基础的文...

7个月前 AI新闻

259

讯飞智作：科大讯飞推出的AI数字人视频与超拟人TTS配音创作平台

讯飞智作是科大讯飞推出的一站式AI音视频智能创作平台，其核心聚焦于“AI数字人”与“AI配音”两大能力，用户只需输入文本或上传PPT，选择合适的数字人形象与声音风格，即可...

7个月前 AI音频制作

343

EasyVoice：免费开源的AI文本转语音工具，一键生成有声书与字幕

EasyVoice是一款免费开源的智能文本转语音解决方案，专注于解决超长文本转换、多角色配音等核心需求，支持10万字以上小说一键转为有声书，具备流式传输、自动字幕生成、多语...

8个月前 AI新闻

899

Supertonic：开源的超高速设备端文本转语音工具

Supertonic是一款开源的文本转语音（TTS）系统，由韩国科技公司Supertone Inc.研发并开源，核心目标是解决传统TTS系统“依赖云服务、延迟高、隐私风险、资源占用大”等痛点...

8个月前 AI新闻

352

SPEECHMA：免费商用级AI语音合成平台，75+语言580+声音随心使用

SPEECHMA 是一个面向全球用户的免费、高质量、支持商业用途的文本转语音（Text-to-Speech, TTS）平台。它致力于打破语音技术的使用壁垒，将先进的AI语音合成能力开放给个人...

7个月前 AI音频制作

430

tts新闻、工具、教程及资源推荐

Qwen3-TTS：通义千问开源的AI语音合成模型，实现多语种语音生成与定制化音色创作

FlowSpeech：支持70+语言的专业AI语音生成器，打造逼真人声TTS配音

VoiceSculptor：开源语音定制合成框架，自然语言指令驱动的音色设计与语音克隆工具

Voicemaker：AI驱动的语音生成与音频增强一体化平台

Chatterbox：开源的高性能TTS模型，支持23种语言零样本克隆与情感语音合成

Kani TTS：轻量级高性能开源文本转语音(TTS)框架，支持多语言与跨硬件优化推理

Maya1：开源高拟真 TTS 系统，支持情感控制与流式音频生成

VoiceNovel：AI语音小说生成平台，一键将文字小说转为沉浸式有声读物

GLM-TTS：智谱 AI 推出的开源文本转语音（TTS）合成工具

VibeVoice：微软开源的 AI 语音合成工具，实现低延迟长音频与多语种语音生成

CosyVoice：阿里通义开源的多语言低延迟 TTS 框架，支持跨语言克隆与流式语音合成

讯飞智作：科大讯飞推出的AI数字人视频与超拟人TTS配音创作平台

EasyVoice：免费开源的AI文本转语音工具，一键生成有声书与字幕

Supertonic：开源的超高速设备端文本转语音工具

SPEECHMA：免费商用级AI语音合成平台，75+语言580+声音随心使用