Qwen3-TTS:通义千问开源的AI语音合成模型,实现多语种语音生成与定制化音色创作
Qwen3-TTS是通义千问开源的一站式多语言语音生成模型全家桶,基于自研Qwen3大模型体系构建,采用离散多码本LM架构与Dual-Track双轨流式生成技术,实现语音克隆、语音设计、...
Qwen3-TTS是通义千问开源的一站式多语言语音生成模型全家桶,基于自研Qwen3大模型体系构建,采用离散多码本LM架构与Dual-Track双轨流式生成技术,实现语音克隆、语音设计、...
VoiceSculptor 是由西北工业大学音频语音与语言处理研究组 主导开发并开源的语音智能处理类开源项目,是一款专注于「自然语言可控的语音定制与语音合成」的全链路工具框架,...
Voicemaker 是一款基于人工智能技术打造的多功能语音生成与处理平台,专注于为用户提供从文本转语音(Text-to-Speech, TTS)、语音到语音转换(Speech-to-Speech)、语音克...
Chatterbox是由Resemble AI团队打造的一款开源生产级文本转语音(TTS)模型家族,并非单一模型,而是三款针对性优化的先进TTS模型组合,整体以轻量化架构实现了媲美商业闭源...
Kani TTS是由nineninesix-ai团队开发并开源的轻量级高性能文本转语音(Text-to-Speech,TTS)框架,旨在为开发者和企业提供快速、高效、类人化的语音生成解决方案。该项目基...
Maya1-Text-to-Speech(以下简称Maya1)是一款基于深度学习构建的开源文本转语音(TTS)系统,主打高拟真语音生成、精细化情感控制与低延迟流式音频输出能力。该项目支持通...
VoiceNovel 是一款基于先进人工智能技术的在线语音小说创作与转换平台,通过深度学习驱动的神经语音合成系统,VoiceNovel 能够将用户上传的小说文本自动分析、分章处理,并...
GLM-TTS是由智谱AI团队开源的一款基于大语言模型(LLM)的高质量文本转语音(TTS)合成系统,其核心设计理念是将大语言模型的语义理解能力与语音合成技术相结合,突破传统T...
VibeVoice是微软开源的一款高性能语音AI研究框架,聚焦于解决传统文本转语音(TTS)系统在长文本处理、多说话人一致性及自然对话生成方面的技术痛点。该框架支持最长90分钟...
CosyVoice是由阿里通义实验室打造的开源TTS项目,其核心定位是面向“野外”真实场景的高质量、高灵活性语音合成框架。作为基于LLM架构的TTS工具,CosyVoice不仅支持基础的文...
讯飞智作是科大讯飞推出的一站式AI音视频智能创作平台,其核心聚焦于“AI数字人”与“AI配音”两大能力,用户只需输入文本或上传PPT,选择合适的数字人形象与声音风格,即可...
EasyVoice是一款免费开源的智能文本转语音解决方案,专注于解决超长文本转换、多角色配音等核心需求,支持10万字以上小说一键转为有声书,具备流式传输、自动字幕生成、多语...
Supertonic是一款开源的文本转语音(TTS)系统,由韩国科技公司Supertone Inc.研发并开源,核心目标是解决传统TTS系统“依赖云服务、延迟高、隐私风险、资源占用大”等痛点...
SPEECHMA 是一个面向全球用户的免费、高质量、支持商业用途的文本转语音(Text-to-Speech, TTS)平台。它致力于打破语音技术的使用壁垒,将先进的AI语音合成能力开放给个人...
Luvvoice 是一款基于深度学习与人工智能技术的先进文本转语音TTS在线工具,致力于为全球用户提供高质量、自然流畅的人工智能语音生成服务。它不仅支持超过70种语言和200种A...