开源框架

TwinFlow：开源大模型单步生成框架，基于自对抗流实现高效图像生成

TwinFlow 是一款面向大模型「单步生成（One-step Generation）」的开源项目，核心目标是解决传统扩散模型在图像生成任务中存在的「生成步数多、推理速度慢、资源消耗高」等...

6个月前 AI新闻

159

UltraEval-Audio：全球首个开源音频大模型全维度评测框架

UltraEval-Audio是全球首个开源的音频大模型专属评测框架，聚焦语音理解与语音生成类任务的全维度、标准化评估。该框架聚合34个权威基准数据集，覆盖语音、声音、医疗、音乐...

6个月前 AI新闻

190

RayAI：开源AI智能体运行时框架，支持分布式部署与安全沙箱执行

RayAI是一款基于Ray分布式计算框架构建的智能体运行时框架，专为AI智能体、MCP服务器和代码沙箱场景设计。它以分布式架构为核心，提供框架无关的兼容性、安全隔离的代码执行...

6个月前 AI新闻

117

Spatia：基于3D场景点云和动态-静态解纠缠的开源视频生成框架

Spatia是一款由悉尼大学、微软研究院等机构联合研发的开源视频生成框架，核心优势在于通过持久化3D场景点云构建可更新的空间记忆，结合动态-静态解纠缠设计，解决了传统视频...

6个月前 AI新闻

149

OmniVCus：多模态控制的开源主题驱动视频生成与编辑框架

OmniVCus是一个开源的视频生成与编辑框架，核心目标是通过多维度的控制条件，实现对视频内容的精准定制——无论是指定主体的动作与场景搭配，还是通过文本指令修改细节、用...

6个月前 AI新闻

144

VideoPipe：轻量级开源视频分析框架，一键搭建视频结构化与行为分析应用

ideoPipe是一款基于C++开发的轻量级开源视频分析与结构化框架，旨在简化计算机视觉算法的集成流程，支持x86_64/aarch64架构的Ubuntu系统及NVIDIA GPU、华为昇腾、瑞芯微RK3...

6个月前 AI新闻

163

InstanceAssemble：开源布局感知图像生成框架，精准匹配稀疏/密集布局约束

InstanceAssemble是一款面向布局到图像（Layout-to-Image）生成的开源轻量级框架，该项目聚焦解决传统图像生成技术中“空间布局控制不精准”的核心痛点——无论是稀疏布局（...

6个月前 AI新闻

129

WeKnora：腾讯开源的LLM文档理解与语义检索框架

WeKnora 是腾讯开源的大语言模型（LLM）驱动文档理解与语义检索框架，专为复杂异构文档场景打造，核心基于检索增强生成（RAG）范式，采用模块化架构设计，支持多格式文档解...

6个月前 AI新闻

186

AnyTalker：香港科技大学开源的音频驱动多人对话视频生成框架

AnyTalker是由香港科技大学研发并开源的一款专注于“音频驱动多人人说话视频生成”的技术框架。不同于传统单一人脸动画生成工具，该框架核心解决了“多人交互场景下视频生成...

6个月前 AI新闻

145

LightX2V：轻量级视频生成推理框架，高性能多模态视频合成与高效部署解决方案

LightX2V 是一款轻量级视频生成推理框架，专注于文本到视频（T2V）与图像到视频（I2V）的高效合成任务。该框架整合了当下主流的视频生成技术，通过模型量化、特征缓存、并行...

6个月前 AI新闻

297

UnityVideo：港科大 & 清华 & 快手可灵联合开源的视频理解与生成框架

UnityVideo 是由香港科技大学、香港中文大学、清华大学与快手可灵联合研发的多模态多任务统一视频理解与生成框架。该框架基于统一 Transformer 骨干网络与联合训练策略，突...

6个月前 AI新闻

155

Wan-Move：阿里通义实验室推出的开源运动可控视频生成框架

Wan-Move是由阿里通义实验室、清华大学、香港大学及香港中文大学等联合开源的运动可控视频生成框架，是人工智能领域顶会NeurIPS 2025的收录研究成果，核心定位是解决传统图...

6个月前 AI新闻

224

PosterCopilot：开源多模态 AI 海报设计与布局优化框架

PosterCopilot是由南京大学PRLab、LibLib.ai与中国科学院自动化研究所联合开发的开源多模态海报设计框架，该框架基于大型多模态模型（LMMs）构建，创新采用三阶段训练范式，...

6个月前 AI新闻

234

GigaWorld-0：极佳视界（GigaAI）开源的具身智能专用世界模型框架

GigaWorld-0是由极佳视界（GigaAI）开源的具身智能专用世界模型框架，其核心定位为“世界模型即数据引擎”，通过GigaWorld-0-Video和GigaWorld-0-3D两大协同组件，首次实现...

7个月前 AI新闻

412

Stand-In：微信CV团队开源的轻量即插即用视频生成身份控制框架

Stand-In是微信CV团队开源的一款轻量级、即插即用的视频生成身份控制框架，核心优势在于仅需训练基础视频生成模型1%的额外参数，就能在人脸相似度和自然度上达到行业领先水...

7个月前 AI新闻

118

开源框架新闻、工具、教程及资源推荐

TwinFlow：开源大模型单步生成框架，基于自对抗流实现高效图像生成

UltraEval-Audio：全球首个开源音频大模型全维度评测框架

RayAI：开源AI智能体运行时框架，支持分布式部署与安全沙箱执行

Spatia：基于3D场景点云和动态-静态解纠缠的开源视频生成框架

OmniVCus：多模态控制的开源主题驱动视频生成与编辑框架

VideoPipe：轻量级开源视频分析框架，一键搭建视频结构化与行为分析应用

InstanceAssemble：开源布局感知图像生成框架，精准匹配稀疏/密集布局约束

WeKnora：腾讯开源的LLM文档理解与语义检索框架

AnyTalker：香港科技大学开源的音频驱动多人对话视频生成框架

LightX2V：轻量级视频生成推理框架，高性能多模态视频合成与高效部署解决方案

UnityVideo：港科大 & 清华 & 快手可灵联合开源的视频理解与生成框架

Wan-Move：阿里通义实验室推出的开源运动可控视频生成框架

PosterCopilot：开源多模态 AI 海报设计与布局优化框架

GigaWorld-0：极佳视界（GigaAI）开源的具身智能专用世界模型框架

Stand-In：微信CV团队开源的轻量即插即用视频生成身份控制框架