Ming-UniAudio:开源统一语音处理框架,支持语音理解、生成与编辑的端到端模型 Ming-UniAudio是一个创新的开源框架,旨在统一语音理解、生成和编辑任务。通过基于VAE框架和因果Transformer架构的统一连续语音tokenizer(MingTok-Audio),它能够有效整合... 16小时前 AI新闻 4
1秒生成1分钟语音!微软AI发布两款自研大模型MAI-Voice-1与MAI-1-preview 近日,微软AI团队宣布推出两款自主研发的创新模型——MAI-Voice-1语音生成模型与MAI-1-preview基础模型,这一举措不仅彰显了其在AI领域的深厚技术积淀,更预示着智能交互体... 1个月前 AI新闻 19