音频模型

音频模型新闻、工具、教程及资源推荐

Audio Flamingo Next（AF-Next）是NVIDIA与马里兰大学联合发布的新一代开源大型音频语言模型，支持30分钟长音频输入与128K上下文窗口，首创时序音频思维链技术，精准锚定时...

SenseVoice是由阿里通义实验室开源的一款具备强大音频理解能力的音频基础模型，致力于为各类语音及声学相关场景提供高效、精准的技术支撑。该模型基于深度学习技术构建，采...