ReplaceAnything:阿里巴巴开源的多场景 AI 超高质量内容替换工具
ReplaceAnything 是由阿里巴巴集团智能计算研究所(Institute for Intelligent Computing, Alibaba Group)开发的超高质量内容替换开源项目,核心目标是为用户提供 “所想即...
ReplaceAnything 是由阿里巴巴集团智能计算研究所(Institute for Intelligent Computing, Alibaba Group)开发的超高质量内容替换开源项目,核心目标是为用户提供 “所想即...
MagicTryOn是一个开源的视频虚拟试穿框架,其核心定位是“基于扩散Transformer的服装保真型虚拟试穿工具”——区别于传统仅支持单张图像的虚拟试穿方案,该框架首次将“大规...
OpenAgents 是一个开源的 AI 代理网络平台,旨在创建一个去中心化的智能体协作生态系统。它提供了灵活的网络基础设施,使各种 AI 代理能够无缝连接、通信和协作,实现从信息...
SceneGen 是一个基于 PyTorch 的开源单图像 3D 场景生成工具,能够通过一次前向传播从单张图像生成完整的 3D 场景。该项目结合了先进的深度学习技术,特别是与 SAM2 模型的...
DeepScientist 是一个由 ResearAI 团队开发的开源 AI 科学发现框架,该项目通过构建自主生成研究假设、设计实验、执行实验和分析结果的闭环系统,大幅提高科学发现的效率。...
Zen MCP Server 是一个开源的多模型协作工作流服务器,能够连接各类 AI 工具与模型,实现跨工具、跨模型的协同工作流。它支持主流 AI 工具和多种 AI 模型,通过 CLI 桥接与...
ReceiptHero是一款开源的收据管理应用,利用AI技术自动提取收据信息,帮助用户轻松管理收据、追踪支出并进行财务分析。通过简单的上传操作,用户可以将收据图片转换为结构化...
Logics-Parsing 是阿里巴巴开源的一款基于视觉语言模型的文档解析框架,能够直接从文档图像输出结构化的 HTML 内容。该项目特别优化了对科学公式、化学结构和复杂表格的识别...
LongLive 是由 NVLabs 联合 MIT、HKUST (GZ)、HKU、THU 等机构开发的开源实时交互式AI长视频生成框架,该框架基于帧级自回归设计,整合 KV-recache、流式长调优、短窗口注意...
FireRedChat是一个完全自托管的全双工语音交互解决方案,旨在帮助开发者构建实时语音AI代理。该系统整合了强大的TTS、ASR、pVAD和EoT功能,使开发者能够创建可定制、注重隐...