Qwen3-TTS:通义千问开源的AI语音合成模型,实现多语种语音生成与定制化音色创作
Qwen3-TTS是通义千问开源的一站式多语言语音生成模型全家桶,基于自研Qwen3大模型体系构建,采用离散多码本LM架构与Dual-Track双轨流式生成技术,实现语音克隆、语音设计、...
Qwen3-TTS是通义千问开源的一站式多语言语音生成模型全家桶,基于自研Qwen3大模型体系构建,采用离散多码本LM架构与Dual-Track双轨流式生成技术,实现语音克隆、语音设计、...
VoiceSculptor 是由西北工业大学音频语音与语言处理研究组 主导开发并开源的语音智能处理类开源项目,是一款专注于「自然语言可控的语音定制与语音合成」的全链路工具框架,...
Liquid Audio是Liquid AI推出的开源端到端语音到语音基础模型项目,核心模型为LFM2-Audio-1.5B。该项目以低延迟为设计理念,基于轻量级LFM2骨干网络,支持实时语音到语音对...