MedASR:谷歌开源的医疗场景专属自动语音识别模型 MedASR是谷歌健康团队开源的医疗领域专用自动语音识别模型,核心聚焦临床语音转文本场景,解决通用ASR模型医疗术语识别不准、误判率高的痛点。该模型基于轻量化Conformer架... 2小时前 AI新闻 64
Whisper:OpenAI 开源多语言语音处理模型,支持语音识别与跨语言翻译 Whisper 是 OpenAI 开发的开源通用语音处理模型,基于 Transformer 架构,通过多任务训练支持多语言语音识别、语音翻译、语言识别等功能。该模型提供 6 种不同规格(从 tin... 1个月前 AI新闻 60