CosyVoice:阿里通义开源的多语言低延迟 TTS 框架,支持跨语言克隆与流式语音合成
CosyVoice是由阿里通义实验室打造的开源TTS项目,其核心定位是面向“野外”真实场景的高质量、高灵活性语音合成框架。作为基于LLM架构的TTS工具,CosyVoice不仅支持基础的文...
CosyVoice是由阿里通义实验室打造的开源TTS项目,其核心定位是面向“野外”真实场景的高质量、高灵活性语音合成框架。作为基于LLM架构的TTS工具,CosyVoice不仅支持基础的文...
LuoGen-agent 是 LuoGen-AI 团队开源的商业级爆款视频自动化生成智能体,集成智能文案处理、高保真语音克隆、数字人口播合成、多平台自动发布等全流程能力,基于 Whisper、...
海豚AI(TTS Online)是一款基于人工智能技术的在线文本转语音(Text-to-Speech, TTS)服务平台,专注于为用户提供高效、自然、富有情感表现力的语音合成解决方案。该平台融...
LOVO AI是一款聚焦“高真实感、强可操作性、全场景适配”的免费AI语音生成器(AI Voice Generator)与文本转语音(Text to Speech, TTS)工具,核心目标是通过AI技术降低音...
CelebrityAI是一个基于先进人工智能技术的在线平台,旨在让用户通过简单的文本输入,在几秒钟内生成由“虚拟明星”出演的高清 AI 视频和语音内容,高度还原真实明星的声音语...
魔音工坊是一款由AI驱动的在线真人配音、语音克隆及音频编辑工具,核心定位为“降低音频创作门槛,赋能全场景内容生产”。它不仅整合了海量真人配音资源,还通过先进的AI技...
声动视界(SoundView) 是由科大讯飞推出的一款面向全球市场的AI视频本地化工具平台,专注于为用户提供短视频翻译、智能配音、自动字幕生成、音色模仿等一站式视频处理服务...
AnyVoice 是一个基于人工智能技术的语音克隆平台,致力于为用户提供高效、精准、便捷的语音合成与克隆服务。通过先进的深度学习算法,AnyVoice 能够在仅需3秒音频样本的情况...