ImageCritic:南开大学开源的AI生成图像细节纠错工具
ImageCritic是由南开大学HVision实验室推出的开源AI图像后处理项目,基于参考引导的注意力对齐机制,专门解决扩散模型生成图像中常见的细节错位、纹理不匹配、结构不一致等...
ImageCritic是由南开大学HVision实验室推出的开源AI图像后处理项目,基于参考引导的注意力对齐机制,专门解决扩散模型生成图像中常见的细节错位、纹理不匹配、结构不一致等...
OpenSandbox是阿里巴巴开源的面向AI应用场景的通用沙箱平台,提供多语言SDK、统一沙箱协议、Docker/Kubernetes双运行时与开箱即用的沙箱环境,可安全支撑代码执行、命令操作...
MoChat是由香港大学HKUDS团队开源的AI智能体原生即时通讯平台,以“Agent-Native(智能体原生)”为核心设计理念,将AI智能体作为平台一等公民,彻底解决了Slack、Discord等...
MimiClaw是一款面向低成本微控制器的开源口袋AI助手,核心定位是将完整的AI智能体能力下沉到仅5美元左右的ESP32-S3硬件平台,打破传统AI助手对高性能硬件、复杂操作系统与云...
InstantID是由InstantX团队联合小红书、北京大学开源的零样本、免微调、单图驱动的身份保留生成模型,基于Stable Diffusion XL与自研IdentityNet、解耦交叉注意力适配器实现...
BitDance是由字节跳动等机构联合推出的开源自回归生成模型项目,核心解决传统离散自回归模型在视觉生成中令牌器重建质量低、词汇表过大采样困难、逐令牌生成速度慢等痛点,...
Maestro 是一款由 pedramamini 主导开发的开源跨平台桌面应用,定位为AI 代理编排指挥中心,专为高频使用 AI 进行编码、多项目并行处理的开发者与极客用户设计。它以键盘优...
OpenStoryline是小红书开源的AI智能体驱动对话式视频创作系统,核心是用自然语言对话完成从素材到成片的全流程视频生成,无需专业剪辑技能,即可自动生成脚本、分镜、剪辑、...
Clawra是SumeLabs发布的一款专为OpenClaw个人AI智能体设计的开源自拍/图片生成技能扩展,以Skill插件形态存在,不独立运行,核心价值是为OpenClaw智能体赋予“可视化形象交...
NanoBot是由香港大学数据科学实验室(HKUDS)开源的超轻量级个人AI智能体框架,以“极简主义”为核心设计理念,仅用约4000行Python代码实现了OpenClaw(Clawdbot)的核心Ag...
PaperBanana是由北京大学与谷歌云AI研究院联合研发的开源智能体框架,核心定位是为AI科学家及科研工作者提供出版级学术插图的全自动化生成服务,解决科研过程中方法流程图、...
InteractAvatar是一款开源的文本驱动、场景感知、人物-物体交互可控的说话数字人(Talking Avatar)生成框架,核心解决当前数字人生成领域长期存在的控制-质量两难问题——...
TeleStyle是由中国电信人工智能研究院(Tele-AI) 开源的内容保留式图像与视频双模态风格迁移模型,基于Qwen-Image-Edit基座与DiT架构构建,在不微调、不针对特定风格训练的...
LLaMA-Factory是一站式统一高效大语言模型与多模态模型微调框架,项目核心目标是降低大模型定制化训练的技术门槛,让零基础用户、开发者、科研人员与企业工程师,都能在无需...
HoloCine是由香港科技大学、蚂蚁集团等机构联合推出的开源文本到视频(T2V)项目,该项目以整体生成为核心理念,通过窗口交叉注意、稀疏镜头间自注意两大核心机制,实现电影...