视频生成

MMX-CLI是MiniMax-AI官方开源的全模态AI命令行工具，专为AI Agent与开发者设计，集成文本对话、图像生成、视频创作、语音合成、音乐制作、视觉理解、网络搜索等核心能力，通...

HiDreamClaw是智象未来推出的、图片与视频生成垂直领域的首个原生AI智能体（AI Agent，俗称“龙虾”），内置自研HiDream AIGC Skill，集成自研及Nano Banana、Veo、Sora等S...

InteractAvatar是一款开源的文本驱动、场景感知、人物-物体交互可控的说话数字人（Talking Avatar）生成框架，核心解决当前数字人生成领域长期存在的控制-质量两难问题——...

VerseCrafter是由复旦大学、香港大学与腾讯ARC Lab联合研发的开源动态真实视频世界模型，核心突破传统视频生成的几何不可控瓶颈，实现对相机运动、多目标3D轨迹及二者协同关...

FantasyWorld 是由高德地图（AMAP）与北京邮电大学联合研发的开源 3D 世界建模框架，核心围绕几何一致的世界建模目标，通过在冻结的视频基础模型上增设可训练的几何分支，实...

LTX-2是由Lightricks团队开源的音视频生成基础模型项目，不同于传统音视频生成模型“音频+视频”分离式设计，LTX-2从底层架构上实现了音视频同步生成，且无需依赖多个独立模...

Spatia是一款由悉尼大学、微软研究院等机构联合研发的开源视频生成框架，核心优势在于通过持久化3D场景点云构建可更新的空间记忆，结合动态-静态解纠缠设计，解决了传统视频...

OmniVCus是一个开源的视频生成与编辑框架，核心目标是通过多维度的控制条件，实现对视频内容的精准定制——无论是指定主体的动作与场景搭配，还是通过文本指令修改细节、用...

Stand-In是微信CV团队开源的一款轻量级、即插即用的视频生成身份控制框架，核心优势在于仅需训练基础视频生成模型1%的额外参数，就能在人脸相似度和自然度上达到行业领先水...

视频生成新闻、工具、教程及资源推荐