VerseCrafter:复旦、港大&腾讯联合开源的 4D 几何可控的动态真实视频世界模型
VerseCrafter是由复旦大学、香港大学与腾讯ARC Lab联合研发的开源动态真实视频世界模型,核心突破传统视频生成的几何不可控瓶颈,实现对相机运动、多目标3D轨迹及二者协同关...
VerseCrafter是由复旦大学、香港大学与腾讯ARC Lab联合研发的开源动态真实视频世界模型,核心突破传统视频生成的几何不可控瓶颈,实现对相机运动、多目标3D轨迹及二者协同关...
FantasyWorld 是由高德地图(AMAP)与北京邮电大学联合研发的开源 3D 世界建模框架,核心围绕几何一致的世界建模目标,通过在冻结的视频基础模型上增设可训练的几何分支,实...
LTX-2是由Lightricks团队开源的音视频生成基础模型项目,不同于传统音视频生成模型“音频+视频”分离式设计,LTX-2从底层架构上实现了音视频同步生成,且无需依赖多个独立模...
Spatia是一款由悉尼大学、微软研究院等机构联合研发的开源视频生成框架,核心优势在于通过持久化3D场景点云构建可更新的空间记忆,结合动态-静态解纠缠设计,解决了传统视频...
OmniVCus是一个开源的视频生成与编辑框架,核心目标是通过多维度的控制条件,实现对视频内容的精准定制——无论是指定主体的动作与场景搭配,还是通过文本指令修改细节、用...
Stand-In是微信CV团队开源的一款轻量级、即插即用的视频生成身份控制框架,核心优势在于仅需训练基础视频生成模型1%的额外参数,就能在人脸相似度和自然度上达到行业领先水...