Audio Flamingo Next:NVIDIA开源长音频理解大模型,支持30分钟全域音频智能分析 Audio Flamingo Next(AF-Next)是NVIDIA与马里兰大学联合发布的新一代开源大型音频语言模型,支持30分钟长音频输入与128K上下文窗口,首创时序音频思维链技术,精准锚定时... 3周前 AI新闻 79
SenseVoice:开源多任务音频基础模型,支持语音识别与声学事件分析 SenseVoice是由阿里通义实验室开源的一款具备强大音频理解能力的音频基础模型,致力于为各类语音及声学相关场景提供高效、精准的技术支撑。该模型基于深度学习技术构建,采... 7个月前 AI新闻 171