ControlFoley:小米开源的可控视频音效生成模型,文本/参考音频双驱动精准配音
ControlFoley是小米开源的可控视频音效生成框架,支持文本引导、文本控制、参考音频控制三大配音任务,通过联合视觉编码、时间-音色解耦等技术,实现高可控、高同步、高音质...
ControlFoley是小米开源的可控视频音效生成框架,支持文本引导、文本控制、参考音频控制三大配音任务,通过联合视觉编码、时间-音色解耦等技术,实现高可控、高同步、高音质...
百音工坊是一站式AI音频创作全流程平台,集文本转语音、声音克隆、语音转文字、音频编辑、视频编辑、AI文案等核心功能于一体,覆盖从文案创作到音视频生成的全链路需求。平...
MuseTalk是腾讯音乐娱乐集团Lyra Lab开源的实时高保真音频驱动唇形同步模型,基于latent空间修复技术,支持中文/英文/日语等多语言音频输入,可对256×256人脸区域精准唇形...
StepAudio 2.5 TTS是阶跃星辰推出的新一代AI文本转语音模型,以全局语境控制、文中语境精细调节、零样本音色复刻为核心能力,支持自然语言描述式情感与风格调控,延迟低、音...
趣丸千音是由广州趣丸网络科技有限公司推出的一站式视频翻译与AI配音平台。平台集成了从字幕识别与擦除、多语种AI翻译、高拟真情感配音到后期合成与交付的完整工作流。
悦音配音是深圳制片帮网络科技有限公司研发的AI智能配音工具,主打AI仿真人情感配音功能,提供网页端与APP端双平台服务,平台依托自研ANN-Turb训练引擎,实现高度拟人化的语...
Listnr AI是一款基于生成式人工智能技术的在线文本转语音(Text-to-Speech)与语音生成平台。该平台的核心功能是将用户输入的文字内容,转换为高度拟人化、自然流畅的语音音...
逗哥配音是一款集智能配音、音频处理与短视频创作辅助于一体的全流程AI语音合成工具平台。其核心功能是将用户输入的文字文本,通过先进的语音合成大模型技术,转化为高度拟...
万象有声是AI赋能的一站式有声内容创作平台,其核心主张是“让每一个故事轻松成声”。其并非一个单点的AI配音工具,而是定位为工业级的AIGC音频基建平台,旨在通过技术、产...
SonificaLabs是一个基于人工智能技术的专业音频内容生产平台。该平台的核心功能是,用户通过输入自然语言描述,即可在无需任何录音设备或专业音频制作技能的情况下,生成适...
AnySpeech是一个面向全球内容创作者的专业AI文本转语音(Text-to-Speech, TTS)平台。该平台的核心功能是将用户输入的文字内容,通过人工智能技术,转换为高质量、自然逼真...
Fun-CineForge是阿里通义实验室FunAudioLLM团队开源的影视级零样本电影配音全栈项目,包含端到端大规模配音数据集构建流水线与多模态配音模型,配套首个大规模中文影视配音...
SenseAudio是商汤科技推出的一站式AI语音与音视频创作平台。它集成了语音识别、语音合成、音色克隆、人声提取等核心技术,旨在为用户提供从语音生成、编辑到交互的完整解决...
Voiceslab是一个AI语音克隆平台,允许用户快速创建自己声音的高保真复制品。用户只需通过朗读一段简短的脚本,即可生成与本人声音高度相似的AI克隆,并利用该克隆声音生成语...
Vois是一款专业的桌面端AI语音工作室,旨在为内容创作者提供从文本脚本到成品音频的一站式、全流程解决方案。它并非简单的在线文本转语音(TTS)工具,而是一个集成了脚本编...