IOPaint:开源 AI 图像智能修复工具,一键擦除瑕疵、替换物体与扩展画幅

原创 发布日期:
60

一、IOPaint是什么

IOPaint是一款基于SOTA(最先进)AI模型的开源图像修复与智能编辑工具,前身为Lama Cleaner,由开发者Sanster维护,采用Apache-2.0开源协议,可完全免费使用、修改与分发。它的核心定位是轻量化、全本地化、易用型AI修图工具,无需专业设计基础,通过简单涂抹、文字描述即可完成图像中物体移除、瑕疵修复、内容替换、画幅扩展、文字生成、背景抠除、超分增强等操作,所有数据处理在本地完成,不上传云端,兼顾隐私安全与使用便捷性。

IOPaint不依赖第三方API、不限制分辨率、不收取订阅费用,支持Windows、Linux、macOS全系统,兼容CPU、NVIDIA GPU、AMD GPU、Apple Silicon全硬件,既提供面向普通用户的浏览器可视化界面(WebUI),也提供面向开发者与批量需求的命令行接口(CLI),可单机使用、内网部署、服务器批量调度,是覆盖个人日常修图、工作室高效生产、企业私有化部署的全能型AI图像处理工具。

从技术架构上看,IOPaint是“前端交互+多模型调度+插件生态”的一体化工程化项目,将复杂的深度学习推理封装为极简操作,把图像分割、语义修复、扩散生成、超分重建、人脸增强等前沿能力整合在一套界面中,让非AI专业用户也能使用工业级AI模型处理图像。

二、IOPaint功能特色

IOPaint以“小体积、强功能、全本地、易上手”为核心特色,功能覆盖从基础擦除到专业级图像编辑,整体可分为四大核心功能、一套插件生态、三大使用优势

(一)四大核心功能

  1. 智能擦除(Erase)
    这是IOPaint最基础也最常用的功能,基于LaMa、MAT等专用擦除模型,可精准移除图像中水印、文字、路人、杂物、电线、瑕疵、污渍、多余物体等任何不需要的内容,处理后边缘自然融合,无明显修复痕迹,支持高分辨率图片无损处理。

  2. 物体替换(Inpainting)
    依托Stable Diffusion Inpainting、PowerPaintV2、BrushNet等扩散模型,用户只需涂抹目标区域并输入文字提示词(Prompt),即可将原有物体替换为新内容,例如把天空替换为晚霞、把沙发替换为实木家具、把普通背景替换为场景化素材,支持写实、动漫、插画等多种风格。

  3. 文字绘制(Draw Text)
    集成AnyText文字生成模型,可在图像指定位置生成贴合场景的自然文字,解决传统文字贴图生硬、不协调问题,适用于海报制作、图片注释、logo添加、产品说明等场景,支持中/英文及多语种生成,文字与背景自动融合。

  4. 图像扩展(Outpainting)
    对图像边界进行外扩,AI自动生成与原图风格一致的内容,实现扩画幅、改比例、补全边缘,例如将竖图扩为横图、将小图扩展为完整场景、将人物照扩展为风景照,生成内容无缝衔接,无拼接感。

(二)插件生态系统

IOPaint采用插件化架构,可按需启用扩展能力,大幅提升工具适用范围,核心插件如下表:

插件名称 核心功能 适用场景
Segment Anything(SAM) 交互式精准物体分割,点选/框选自动生成蒙版 复杂边缘物体选择、一键抠取目标区域
RemoveBG 通用图像背景移除,生成透明底 电商产品图、证件照、素材抠图
Anime Seg 动漫/二次元专用背景分割 动漫插画、二次元角色抠图
RealESRGAN 图像超分辨率重建,提升清晰度 老照片修复、低清图放大、细节增强
GFPGAN / RestoreFormer 人脸修复与增强,优化五官与画质 人像照片修复、模糊人脸变清晰

(三)三大核心优势

  1. 全本地自托管,隐私绝对安全
    所有模型下载到本地,图像处理全程离线完成,不联网、不上传、不收集数据,适合处理私密照片、商业素材、敏感内容,解决云端修图的数据泄露风险。

  2. 全硬件兼容,低配置也能跑
    支持CPU(低配可用)、NVIDIA GPU(CUDA加速)、AMD GPU(Linux)、Apple Silicon(M1/M2/M3),普通笔记本可流畅运行,高性能显卡可秒出图。

  3. 双模式操作,兼顾新手与专业
    WebUI可视化界面:浏览器打开即用,拖拽上传、画笔涂抹、一键生成,零学习成本;
    CLI命令行模式:支持批量处理上千张图片,可接入脚本、定时任务、自动化流程。

三、IOPaint技术细节

IOPaint是工程化成熟度极高的开源AI项目,技术栈清晰、模型调度高效、推理优化到位,整体分为前端交互层、后端服务层、模型推理层、插件扩展层四部分。

(一)技术栈构成

  • 前端:React + Next.js,轻量化Web界面,响应式布局,支持画笔、蒙版、选区、参数调节、实时预览;

  • 后端:Python + FastAPI,轻量高效API服务,模型加载与调度管理;

  • 推理引擎:PyTorch + Diffusers,兼容主流Stable Diffusion系列模型,支持fp16/int8量化加速;

  • 插件系统:模块化设计,动态加载,按需启用,不占用多余资源。

(二)核心AI模型体系

IOPaint支持三大类模型,用户可根据需求切换:

  1. 擦除专用模型

    • LaMa:大掩码修复,边缘自然,速度快,适合水印、物体移除;

    • MAT:高精度细节修复,适合复杂纹理场景;

    • MI-GAN:针对人像与风景优化,修复更自然。

  2. 扩散修复/扩展模型

    • runwayml/stable-diffusion-inpainting:经典通用修复模型;

    • Stable Diffusion XL 1.0 Inpainting:高清高质量生成;

    • PowerPaintV2 / BrushNet:任务专用优化,替换/扩图效果更稳定;

    • Realistic Vision、DreamShaper:写实风格强化;

    • AnyText:文字生成专用模型。

  3. 辅助增强模型
    SAM(分割)、RMBG(抠图)、RealESRGAN(超分)、GFPGAN(人脸)。

(三)性能优化技术

  1. 模型自动下载与缓存:首次启动自动拉取Hugging Face模型,本地缓存,重复使用秒加载;

  2. 硬件自适应调度:自动检测CPU/GPU,选择最优推理方式,NVIDIA显卡默认启用CUDA加速;

  3. 内存优化:支持模型卸载、显存分片加载,低配置设备也可运行大模型;

  4. 批量处理引擎:命令行模式支持多线程并行处理,批量处理效率提升数倍。

(四)部署架构

  • 单机部署:本地启动Web服务,端口默认8080,浏览器访问127.0.0.1:8080;

  • 服务器部署:支持内网/公网部署,多用户共享使用;

  • Docker部署:提供容器化方案,环境一键封装,跨平台迁移无压力。

IOPaint:开源 AI 图像智能修复工具,一键擦除瑕疵、替换物体与扩展画幅

四、IOPaint应用场景

IOPaint功能全面、门槛低、效率高,覆盖个人、自媒体、电商、设计、教育、企业等全场景,典型应用如下:

  1. 个人日常修图

    • 旅游照删除路人、电线杆、杂物;

    • 证件照去除水印、修复瑕疵;

    • 老照片修复、模糊人脸增强;

    • 图片扩画幅、改比例适配社交平台。

  2. 电商与美工

    • 产品图去水印、去logo、修瑕疵;

    • 产品背景替换、透明底生成;

    • 批量处理商品图,提升效率;

    • 海报文字生成、场景扩展。

  3. 内容创作与自媒体

    • 短视频素材擦除字幕、水印;

    • 封面图扩展、元素替换;

    • 插画/动漫图扩图、背景修改。

  4. 设计与影视后期

    • 图像局部修复、物体移除;

    • 场景扩展、镜头补全;

    • 素材预处理,快速生成可用资源。

  5. 企业私有化使用

    • 内部素材处理,数据不上云;

    • 批量处理品牌素材、宣传物料;

    • 接入自动化流程,降低人力成本。

五、IOPaint使用方法

IOPaint提供极简安装、双模式操作,新手5分钟上手,专业用户可深度定制。

(一)环境要求

  • 系统:Windows 10+/macOS 10.15+/Linux

  • Python:3.8及以上

  • 硬件:CPU即可运行,NVIDIA GPU(支持CUDA)可加速

(二)安装方式

  1. PIP一键安装(推荐)

pip install iopaint
  1. Windows一键包
    官方提供exe安装包,双击安装,无需配置Python环境。

  2. 源码安装

git clone https://github.com/Sanster/IOPaint.git
cd IOPaint
pip install -r requirements.txt
  1. Docker部署

# CPU版
docker run -p 8080:8080 -v ./models:/app/models sanster/iopaint --model=lama --device=cpu

# GPU版
docker run --gpus all -p 8080:8080 -v ./models:/app/models sanster/iopaint --model=lama --device=cuda

(三)WebUI使用步骤(最常用)

  1. 启动服务

# CPU+LaMa擦除模型
iopaint start --model=lama --device=cpu --port=8080

# GPU+PowerPaintV2模型
iopaint start --model=powerpaint_v2 --device=cuda --port=8080
  1. 浏览器访问
    打开 http://127.0.0.1:8080

  2. 上传图片
    拖拽或点击上传,支持JPG/PNG/WebP等格式。

  3. 标记处理区域

    • 画笔:涂抹需要处理的地方;

    • 橡皮擦:修正蒙版;

    • SAM插件:点击物体自动选中。

  4. 执行操作

    • 擦除:直接点击Run;

    • 替换/扩图:输入Prompt,点击Run;

    • 文字生成:输入文字,调整位置,点击Run。

  5. 保存结果
    预览满意后下载到本地。

(四)命令行批量处理

适合大量图片自动化处理:

iopaint run \
--model=lama \
--device=cuda \
--image=/path/input_folder \
--mask=/path/mask_folder \
--output=/path/output_folder

(五)插件启用

启动时添加参数即可:

iopaint start \
--model=lama \
--device=cuda \
--enable-interactive-seg \
--enable-remove-bg \
--enable-realesrgan \
--enable-gfpgan

六、常见问题解答(FAQ)

问:IOPaint完全免费吗?可以商用吗?

答:是的,IOPaint采用Apache-2.0开源协议,个人与商业使用完全免费,可自由修改、分发、部署。

问:没有GPU可以用吗?速度怎么样?

答:可以用,CPU模式可正常运行,小图片处理速度较快;大分辨率图片建议使用NVIDIA GPU加速,效率提升10-50倍。

问:处理图片会上传到云端吗?

答:不会,所有模型与处理都在本地进行,断网也能正常使用,绝对保护隐私。

问:支持哪些图片格式?有分辨率限制吗?

答:支持JPG、PNG、WebP、BMP等常见格式,无分辨率上限,根据硬件性能自适应。

问:模型下载慢/失败怎么办?

答:可手动下载模型到本地文件夹,启动时用--model-dir指定路径;也可使用国内镜像加速。

问:如何切换不同的AI模型?

答:停止当前服务,重新启动时修改--model参数,如--model=sd_inpaint、--model=powerpaint_v2、--model=anytext。

问:SAM分割插件怎么使用?

答:启动时启用--enable-interactive-seg,在界面点击目标物体即可自动生成蒙版,无需手动涂抹。

问:可以批量处理几百张图片吗?

答:可以,使用CLI命令行模式,指定输入文件夹、蒙版文件夹、输出文件夹,即可全自动批量处理。

问:人脸修复、超分功能怎么开启?

答:启动时添加--enable-gfpgan(人脸)、--enable-realesrgan(超分)参数,界面会出现对应功能按钮。

问:macOS M系列芯片能用吗?

答:完美支持Apple Silicon,启动时--device=mps,速度接近NVIDIA GPU。

问:处理后效果不自然怎么办?

答:可调整蒙版精度、更换模型、调整提示词(替换/扩图)、使用更小的处理区域提升质量。

问:可以在服务器/内网部署供多人使用吗?

答:可以,启动时监听0.0.0.0,开放端口,内网用户可通过IP+端口访问使用。

七、相关链接

八、总结

IOPaint是一款功能完整、轻量化、全本地、易使用的开源AI图像修复与编辑工具,整合擦除、替换、文字生成、图像扩展四大核心能力,搭配SAM分割、背景抠除、超分、人脸修复等插件,依托LaMa、Stable Diffusion Inpainting、PowerPaintV2等前沿模型实现高质量图像处理,支持CPU/GPU/Apple Silicon全硬件运行,提供WebUI与命令行双操作模式,兼顾普通用户的极简需求与专业用户的批量生产需求,所有处理本地完成保障数据隐私,无付费、无水印、无分辨率限制,适用于个人修图、电商美工、内容创作、设计工作室、企业私有化素材处理等各类场景,是当前开源社区中成熟度高、实用性强、口碑优秀的AI修图解决方案。

打赏
THE END
作者头像
97ai
我不是在训练模型,而是在与未来的自己对话。