开源语音模型

Moonshine Voice是moonshine-ai团队开源的端侧实时自动语音识别（ASR）工具包，主打本地离线运行、毫秒级低延迟、轻量化高精度、全平台兼容，在核心数据集上词错误率（WER）...

Qwen3-TTS是通义千问开源的一站式多语言语音生成模型全家桶，基于自研Qwen3大模型体系构建，采用离散多码本LM架构与Dual-Track双轨流式生成技术，实现语音克隆、语音设计、...

VoiceSculptor 是由西北工业大学音频语音与语言处理研究组主导开发并开源的语音智能处理类开源项目，是一款专注于「自然语言可控的语音定制与语音合成」的全链路工具框架，...

Liquid Audio是Liquid AI推出的开源端到端语音到语音基础模型项目，核心模型为LFM2-Audio-1.5B。该项目以低延迟为设计理念，基于轻量级LFM2骨干网络，支持实时语音到语音对...

开源语音模型新闻、工具、教程及资源推荐