Parallax:开源分布式AI模型服务框架,灵活构建跨节点智能集群
Parallax是一款开源的分布式模型服务框架,由AI技术公司Gradient开发并开源。其核心定位是“让用户在任何地方构建自己的AI集群”,解决传统LLM推理依赖高配置单节点或中心化...
Parallax是一款开源的分布式模型服务框架,由AI技术公司Gradient开发并开源。其核心定位是“让用户在任何地方构建自己的AI集群”,解决传统LLM推理依赖高配置单节点或中心化...
ViMax是由香港大学开源多智能体视频生成框架,旨在解决当前AI视频生成“片段短、一致性差、缺乏叙事深度”的核心痛点。该工具集导演、编剧、制片人、视频生成器功能于一体,...
KTransformers是一款基于CPU-GPU异构计算的开源框架,专注于大型语言模型(LLM)的高效推理与微调优化。项目核心包含kt-kernel(高性能推理内核)和kt-sft(轻量化微调框架...
DroidRun是一款开源的移动设备自动化框架,核心定位是通过LLM(大语言模型)智能体实现对Android和iOS设备的自然语言控制,让非技术用户与专业开发者都能轻松完成移动设备的...
InfinityStar 是字节跳动开源的视觉生成框架,核心基于统一时空自回归建模,实现了图像与视频生成的一体化解决方案。该框架突破传统自回归模型的局限,首次支持工业级 720p...
DeepEyesV2 是一款开源的多模态智能体框架,以 Qwen-2.5-VL 系列模型为基础,核心创新在于将视觉理解、代码执行与网络搜索三大能力深度融合进单一推理循环,通过 “冷启动微...
Glyph是一个创新的开源框架,通过视觉-文本压缩技术解决大模型长上下文处理难题。其核心逻辑是将超长文本渲染为紧凑图像,借助视觉-语言模型(VLMs)实现高效语义理解,在降...
Agent Squad 是 AWS Labs 开发的一款灵活、轻量的开源框架,专注于实现多个 AI 代理(Agents)的高效协作与任务编排,以处理复杂对话场景。它具备智能意图分类、动态代理路...
LLaVA-OneVision-1.5 是由 EvolvingLMMs-Lab 开发的全开源多模态模型框架,专注于通过原生分辨率图像训练实现高性能、低成本的大型多模态模型(LMMs)。该项目提供从数据处...
dInfer 是蚂蚁集团开源的针对扩散语言模型(dLLMs)的高效可扩展推理框架,该框架通过模块化设计将推理流程拆解为模型、扩散迭代管理器、解码策略、KV 缓存管理四大组件,支...
TANGO 是一个由 CyberAgent AI Lab 开发的开源项目,专注于从音频和参考视频生成同步语音手势的全身视频。该项目结合了分层音动嵌入和扩散插值技术,实现了高质量的动作生成...
MagicTryOn是一个开源的视频虚拟试穿框架,其核心定位是“基于扩散Transformer的服装保真型虚拟试穿工具”——区别于传统仅支持单张图像的虚拟试穿方案,该框架首次将“大规...
Hunyuan3D-Omni是腾讯混元团队推出的开源3D资产生成框架,该框架通过统一的控制编码器,能够接收多种不同类型的控制信号,实现对3D资产生成过程的精确引导。。它不仅能根据...