ROMA:基于递归开放式元代理框架的高性能多智能体系统开发工具
ROMA是一个开源的分层任务执行框架,旨在简化复杂多智能体系统的构建过程。该框架基于MECE原则设计,将所有任务拆解为"思考(THINK)、写作(WRITE)、搜索(SEARCH)"三种...
ROMA是一个开源的分层任务执行框架,旨在简化复杂多智能体系统的构建过程。该框架基于MECE原则设计,将所有任务拆解为"思考(THINK)、写作(WRITE)、搜索(SEARCH)"三种...
Robust Video Matting(RVM) 是由字节跳动(ByteDance)开发的开源视频抠图工具,专注于从视频中高精度分离前景人物与背景。与传统逐帧处理的抠图方法不同,RVM通过循环神...
Story Flicks是一款基于 多模态AI大模型 的开源视频生成工具,用户只需输入一个故事主题,系统就能自动生成包含 高清图像、动态分镜、多语言配音、智能字幕 的完整短视频。...
Mini-o3(或称为o3-mini)是OpenAI于2025年2月推出的低成本高性能推理模型,属于其“推理系列”模型中的最新成员,定位为旗舰模型o3的经济版。它的核心目标是在STEM领域(科...
DeepFaceLive是一款基于深度学习技术的开源实时人脸交换软件,由俄罗斯开发者iperov团队开发,作为著名换脸项目DeepFaceLab的"兄弟项目"而诞生。该项目专注于将原本需要长时...
LaVie 是一个基于 PyTorch 实现的AI文生视频框架,它是视频生成系统 Vchitect 的核心组成部分。LaVie 旨在通过深度学习模型,将用户输入的自然语言文本转化为高质量的视频内...
Linly-Dubbing是一款开源的多语言AI视频配音和翻译工具,旨在通过先进的AI技术实现高质量的视频内容本地化。它能自动下载视频、翻译字幕、分离人声、克隆音色配音并合成视频...
AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一款零代码、全自动化的大型语言模型(LLM)智能体框架,其核心理念是"让AI开发无门槛"。该项目旨在通过纯自然语言交互,让...
AI-Media2Doc是一款基于Web的开源创作工具,它利用AI大模型技术将视频和音频内容智能转换为多种风格的文档形式。与传统的音视频转文字工具不同,AI-Media2Doc不仅提供基础的...
Orca Browser是由加州大学圣地亚哥分校(UCSD)研究团队于2025年9月发布的全球首个智能体浏览器,其核心理念是通过空间化画布和多智能体协同彻底重构传统浏览器的单页面线性...