MedASR:谷歌开源的医疗场景专属自动语音识别模型 MedASR是谷歌健康团队开源的医疗领域专用自动语音识别模型,核心聚焦临床语音转文本场景,解决通用ASR模型医疗术语识别不准、误判率高的痛点。该模型基于轻量化Conformer架... 1个月前 AI新闻 88
Omnilingual ASR:Meta开源的多语言语音识别系统,支持1600+语言的高效语音转文字工具 Omnilingual ASR是由Meta(Facebook Research)开源的多语言语音识别系统,支持全球超过1600种语言(含数百种稀有语言),提供从300M到7B的多规格模型,支持零样本学习与无... 1个月前 AI新闻 71