Whisper:OpenAI 开源多语言语音处理模型,支持语音识别与跨语言翻译 Whisper 是 OpenAI 开发的开源通用语音处理模型,基于 Transformer 架构,通过多任务训练支持多语言语音识别、语音翻译、语言识别等功能。该模型提供 6 种不同规格(从 tin... 1个月前 AI新闻 44
通义听悟:阿里推出的AI实时音视频转文字工具 通义听悟是由阿里巴巴集团推出的一款基于人工智能技术的音视频内容处理工具,专注于将语音与视频内容实时转换为文字,并提供智能分析、内容摘要、关键词提取等高级功能。 3个月前 AI办公提效 50