Voice-Pro:轻量型开源语音工具集,集成识别、克隆与多语言配音
Voice-Pro是一款基于Python开发的AI驱动型语音处理网页应用,集成Whisper、F5-TTS、Demucs等主流模型,提供语音识别、零样本语音克隆、多语言文本转语音、音频分离、YouTub...
Voice-Pro是一款基于Python开发的AI驱动型语音处理网页应用,集成Whisper、F5-TTS、Demucs等主流模型,提供语音识别、零样本语音克隆、多语言文本转语音、音频分离、YouTub...
TurboScribe 是一款由人工智能(AI)驱动的在线语音与视频转文字服务,致力于为用户提供高效、精准、安全的音频/视频内容文本化解决方案。它利用先进的自然语言处理(NLP)...
TransPocket 是一款基于先进人工智能技术打造的在线音频视频转文字服务工具,致力于为用户提供高效、精准、安全的语音内容数字化解决方案。依托 OpenAI 开发的 Whisper 系列...
GLM-ASR 是由智谱 AI 团队开源的一款轻量级高性能语音识别项目,核心模型为 GLM-ASR-Nano-2512,参数规模仅 1.5B,却在多项语音识别基准测试中表现优于 OpenAI Whisper V3。...
MemoAI 是一款基于生成式人工智能技术的音视频内容智能处理平台,专注于将音频和视频内容高效转化为文本,并提供多语言翻译、语音合成、AI摘要、实时字幕、说话人分离等高级...
Any2Text 是一款基于先进人工智能技术开发的完全免费、无需注册的在线音频与视频转文字工具。它利用强大的AI语音识别引擎,能够将用户上传的音频或视频文件快速、准确地转换...
AudioConvert.ai 是一款基于人工智能技术开发的在线语音识别与音频转文字平台,其利用前沿的深度学习模型和自然语言处理(NLP)算法,能够将各类音频或视频文件中的语音内容...
Voquill 是一款革命性的语音输入工具,作为 WisprFlow 的开源替代方案,Voquill 提供快速、安全、智能的语音打字体验,支持在 macOS、Windows 和 Linux 系统上全局运行,适...
OpenWhispr 是一款基于人工智能的语音听写工具,主打隐私优先、开源免费、跨平台使用。它能将用户的自然口语快速转化为清晰、结构化的文本内容,效率是手动打字的3倍以上。...
Transkriptor 是一款基于人工智能技术的语音转文字工具,通过强大的AI算法,Transkriptor 能够实现高精度、多语言、多场景的自动转录服务,并提供智能摘要、会议记录、翻译...