SongGeneration 2:腾讯、清华大学联合开源的AI音乐大模型,商用级歌曲生成与多语种精准演唱
SongGeneration 2是腾讯AI Lab与清华大学联合研发的开源商用级AI歌曲生成大模型,基于LeVo 2架构,采用LLM与Diffusion混合设计,支持最长4分30秒完整歌曲、多语种精准演唱、...
SongGeneration 2是腾讯AI Lab与清华大学联合研发的开源商用级AI歌曲生成大模型,基于LeVo 2架构,采用LLM与Diffusion混合设计,支持最长4分30秒完整歌曲、多语种精准演唱、...
Phi-4-reasoning-vision-15B是微软开源的150亿参数轻量多模态视觉推理模型,基于“中融合架构”整合视觉感知、文本理解与逻辑推理三大核心能力,具备动态分辨率编码、自适应...
Mobile-Agent-v3.5是阿里巴巴通义实验室X-PLUG团队开源的新一代多平台原生GUI智能体基座,依托GUI-Owl-1.5多模态模型家族,实现手机、PC、浏览器的统一自动化操作,具备精准...
Yuan3.0 Ultra是由浪潮信息YuanLab.ai团队开源的万亿参数级多模态基础大模型,基于MoE混合专家架构,通过LAEP层自适应专家剪枝、RIRM反射抑制奖励、LFA局部滤波注意力三大核...
HiClaw是一款开源的AI智能体团队协作系统,基于OpenClaw构建,采用Manager-Worker架构,内置Matrix即时通讯与Higress AI网关,支持单命令极速部署、安全凭证隔离、8万+社区...
肉包(Roubao)是一款开源的Android AI手机自动化助手,基于Kotlin原生编写,依托视觉语言模型与多Agent协作架构,无需电脑、ADB与Python环境,用户通过自然语言指令即可让...
ymphony是OpenAI开源的编码智能体编排框架,可将项目任务转化为隔离、自主的执行流程,让团队专注管理工作而非监督AI智能体,支持任务轮询、环境隔离、自动重试、成果验证与...
JadeAI是一款基于Next.js与TypeScript开发的开源AI智能简历构建工具,提供50+专业模板、可视化拖拽编辑、AI一键生成、PDF/图片解析、JD匹配评分、多格式导出等能力,支持Do...
HY-WU(混元无相)是腾讯混元团队开源的可扩展功能性神经记忆框架,通过推理时实时生成实例级LoRA参数,解决传统模型静态权重导致的灾难性遗忘与性能跷跷板问题,专注文本引...
Faster-Whisper是由SYSTRAN团队开发并开源的OpenAI Whisper语音转文本模型的高性能重构实现,核心依托CTranslate2——一款专为Transformer架构设计的轻量级、高性能推理引擎...