DeepGen 1.0:上海创智研究院推出的5B参数多模态图像生成编辑模型
DeepGen 1.0是上海创智研究院DeepGen团队发布的轻量级统一多模态开源模型,聚焦于图像生成与编辑核心任务,是一款专为解决大参数量多模态模型训练成本高、部署门槛高、推理...
DeepGen 1.0是上海创智研究院DeepGen团队发布的轻量级统一多模态开源模型,聚焦于图像生成与编辑核心任务,是一款专为解决大参数量多模态模型训练成本高、部署门槛高、推理...
Ming-omni-tts是inclusionAI开源的高性能端到端统一音频生成模型,依托自研12.5Hz连续音频Tokenizer与Patch-by-Patch压缩策略,实现语音、音乐、环境音效单通道联合生成,支...
Seedance 2.0 是由字节跳动旗下 Seed 团队研发并在即梦平台上线的新一代多模态视频生成模型。它不仅仅是一个“文生视频”工具,而是被官方定义为“电影级全流程生成引擎”。...
PaperBanana是由北京大学与谷歌云AI研究院联合研发的开源智能体框架,核心定位是为AI科学家及科研工作者提供出版级学术插图的全自动化生成服务,解决科研过程中方法流程图、...
ACE-Step 1.5是一款由ACE Studio与StepFun联合开发的开源音乐生成基础模型,主打在消费级硬件上实现商用级别的音乐生成能力,仅需4GB显存即可本地运行,兼具极速生成、多语...
OpenClaw 飞书机器人完整部署指南:Linux 服务器一键安装、App ID 配置、WebSocket 连接、消息事件权限开通与版本发布。支持 Shell 执行与网页自动化,数据完全本地化。
SoulX-FlashTalk是由Soul AI Lab(Soul App人工智能实验室)联合东华大学研发并开源的实时音频驱动数字人无限流式生成模型,核心定位是解决传统数字人生成技术中“高画质必...
腾讯开源视频大模型HunyuanVideo(130B参数)从零部署实战:环境配置、HF模型下载、LLaVA/CLIP文本编码器预处理、Gradio服务启动,附避坑清单与性能实测。
Step 3.5 Flash是阶跃星辰(StepFun)发布的面向智能体(Agent)场景的开源基座大语言模型,采用稀疏混合专家(MoE)架构,总参数量196.81B,每token仅激活约11B参数,在保...
零基础也能会!Moltbot/Clawdbot 安装教程涵盖 Windows/Mac 系统部署、多模型(Claude/GLM/GPT)配置、多平台集成,附常用指令 + 故障排除,手把手搭建 AI 助手。
