RayAI:开源AI智能体运行时框架,支持分布式部署与安全沙箱执行
RayAI是一款基于Ray分布式计算框架构建的智能体运行时框架,专为AI智能体、MCP服务器和代码沙箱场景设计。它以分布式架构为核心,提供框架无关的兼容性、安全隔离的代码执行...
RayAI是一款基于Ray分布式计算框架构建的智能体运行时框架,专为AI智能体、MCP服务器和代码沙箱场景设计。它以分布式架构为核心,提供框架无关的兼容性、安全隔离的代码执行...
Spatia是一款由悉尼大学、微软研究院等机构联合研发的开源视频生成框架,核心优势在于通过持久化3D场景点云构建可更新的空间记忆,结合动态-静态解纠缠设计,解决了传统视频...
OmniVCus是一个开源的视频生成与编辑框架,核心目标是通过多维度的控制条件,实现对视频内容的精准定制——无论是指定主体的动作与场景搭配,还是通过文本指令修改细节、用...
ideoPipe是一款基于C++开发的轻量级开源视频分析与结构化框架,旨在简化计算机视觉算法的集成流程,支持x86_64/aarch64架构的Ubuntu系统及NVIDIA GPU、华为昇腾、瑞芯微RK3...
InstanceAssemble是一款面向布局到图像(Layout-to-Image)生成的开源轻量级框架,该项目聚焦解决传统图像生成技术中“空间布局控制不精准”的核心痛点——无论是稀疏布局(...
WeKnora 是腾讯开源的大语言模型(LLM)驱动文档理解与语义检索框架,专为复杂异构文档场景打造,核心基于检索增强生成(RAG)范式,采用模块化架构设计,支持多格式文档解...
AnyTalker是由香港科技大学研发并开源的一款专注于“音频驱动多人人说话视频生成”的技术框架。不同于传统单一人脸动画生成工具,该框架核心解决了“多人交互场景下视频生成...
LightX2V 是一款轻量级视频生成推理框架,专注于文本到视频(T2V)与图像到视频(I2V)的高效合成任务。该框架整合了当下主流的视频生成技术,通过模型量化、特征缓存、并行...
UnityVideo 是由香港科技大学、香港中文大学、清华大学与快手可灵联合研发的多模态多任务统一视频理解与生成框架。该框架基于统一 Transformer 骨干网络与联合训练策略,突...
Wan-Move是由阿里通义实验室、清华大学、香港大学及香港中文大学等联合开源的运动可控视频生成框架,是人工智能领域顶会NeurIPS 2025的收录研究成果,核心定位是解决传统图...
PosterCopilot是由南京大学PRLab、LibLib.ai与中国科学院自动化研究所联合开发的开源多模态海报设计框架,该框架基于大型多模态模型(LMMs)构建,创新采用三阶段训练范式,...
GigaWorld-0是由极佳视界(GigaAI)开源的具身智能专用世界模型框架,其核心定位为“世界模型即数据引擎”,通过GigaWorld-0-Video和GigaWorld-0-3D两大协同组件,首次实现...
Stand-In是微信CV团队开源的一款轻量级、即插即用的视频生成身份控制框架,核心优势在于仅需训练基础视频生成模型1%的额外参数,就能在人脸相似度和自然度上达到行业领先水...
MobiAgent是一款开源的可定制移动智能体系统,该框架核心包含MobiMind代理模型家族、AgentRR加速框架与MobiFlow评测基准三大模块,支持通过ADB连接Android设备,实现跨应用...
InfiniteTalk是由美团视觉智能团队开源的音频驱动视频生成框架,专为稀疏帧视频配音(Sparse-Frame Video Dubbing)设计,同时支持图像到视频(Image-to-Video)和视频到视...