CosyVoice:阿里通义开源的多语言低延迟 TTS 框架,支持跨语言克隆与流式语音合成
CosyVoice是由阿里通义实验室打造的开源TTS项目,其核心定位是面向“野外”真实场景的高质量、高灵活性语音合成框架。作为基于LLM架构的TTS工具,CosyVoice不仅支持基础的文...
CosyVoice是由阿里通义实验室打造的开源TTS项目,其核心定位是面向“野外”真实场景的高质量、高灵活性语音合成框架。作为基于LLM架构的TTS工具,CosyVoice不仅支持基础的文...
LuoGen-agent 是 LuoGen-AI 团队开源的商业级爆款视频自动化生成智能体,集成智能文案处理、高保真语音克隆、数字人口播合成、多平台自动发布等全流程能力,基于 Whisper、...
2025年12月Mistral AI推出第二代开源编码模型Devstral 2与Devstral Small 2,其中Devstral 2具备1230亿参数、72.2%的SWE-Bench Verified得分,成本效率较Claude Sonnet提升...
DeepSeek-V3.2是一款智能水平位居开源权重模型第二名的高效能大模型,其核心优势源于DeepSeek稀疏注意力技术脱离实验性阶段并实现规模化应用,不仅超越Grok 4、Claude Sonn...
通用AI助手“灵光”近日宣布推出全新核心能力——科普动画生成,该功能聚焦教育科普场景,通过将抽象复杂的科学原理转化为直观生动的动态动画,打造“会动的数字黑板板书”...
AI Toolkit是由Ostris团队开源的全能型扩散模型训练套件,其核心定位是为消费级硬件用户提供低成本、高易用性的图像与视频扩散模型训练解决方案。不同于专业级AI训练工具对...
Keye-VL是快手Keys团队面向多模态AI领域开源的高性能多模态大语言模型(VLM),全称为Kwai Keye-VL,是快手先进AI技术生态中的核心开源项目。该项目并非单一模型,而是包含...
Repo2Run是字节跳动开源的一款基于大语言模型(LLM)的构建代理系统,其核心目标是为各类代码仓库自动化搭建可执行的容器化运行环境。该工具以Docker为沙箱实现构建过程隔离...
在谷歌、Anthropic等厂商的激烈竞争下,OpenAI旗下的GPT-5.1依旧稳居全球顶尖AI模型行列。近日,OpenAI官方播客邀请到了ChatGPT团队核心成员,分享了这款模型的核心使用技巧...
12月9日消息,蚂蚁集团旗下全模态通用AI助手灵光正式推出网页版,用户可通过浏览器直接访问,在电脑端体验其核心功能,“灵光对话”和“灵光闪应用”,进一步提升了工作与学...