Ming-UniAudio:开源统一语音处理框架,支持语音理解、生成与编辑的端到端模型 Ming-UniAudio是一个创新的开源框架,旨在统一语音理解、生成和编辑任务。通过基于VAE框架和因果Transformer架构的统一连续语音tokenizer(MingTok-Audio),它能够有效整合... 16小时前 AI新闻 4