Fooocus：开源免费的离线AI图片生成工具，轻松实现文本到图像的创意转化

AI新闻 AI铺子 9个月前

214

一、Fooocus是什么

Fooocus是一款基于Stable Diffusion XL架构的离线开源免费图片生成软件，通过Gradio构建交互界面，以简化操作为设计理念，让用户无需复杂参数调整即可专注于提示词和图片生成。它具备文本到图片生成、图片优化、局部/扩展绘制等丰富功能，支持多平台安装使用，适用于艺术创作、设计等多种场景，为用户提供了便捷高效的图片生成解决方案。

该项目的设计理念与Midjourney等知名在线图片生成工具相似，着重于简化用户的操作流程。在使用过程中，用户无需进行复杂的参数调整，只需将精力集中在提示词（prompt）的构思以及生成图片的效果把控上，大大降低了图片生成的技术门槛，让更多用户能够轻松上手进行创作。

就项目状态而言，Fooocus当前处于有限长期支持（LTS）阶段。这意味着开发团队主要精力将放在bug修复上，以保证现有功能的稳定运行。虽然目前其功能已趋于稳定，但暂无迁移到新模型架构（如Flux）的计划。不过，未来若开源社区形成单一主导的图片生成方法，开发团队可能会考虑进行架构迁移。

若用户有使用Flux等新模型的需求，官方推荐尝试一些相关的优秀工具或分支，如WebUI Forge、ComfyUI/SwarmUI，以及Fooocus的分支fenneishi/Fooocus-Control等。

Fooocus：开源免费的离线AI图片生成工具，轻松实现文本到图像的创意转化

二、功能特色

Fooocus提供了丰富多样的图片生成及处理功能，在诸多方面展现出独特的优势，以下通过表格详细介绍其主要功能场景及具体说明：

功能场景	具体说明
文本到图片生成	无需复杂的提示词工程，内置了基于GPT-2的提示词处理引擎和采样优化机制。无论是简短的提示词还是较长的描述，都能生成高质量的图片，有效降低了用户在提示词创作上的难度
图片优化	支持图片的 upscale（1.5x/2x）操作，可提升图片的分辨率；同时提供变体生成功能，包括Subtle（细微变体）和Strong（显著变体），满足用户对图片多样化的需求
局部/扩展绘制	支持Inpaint（局部重绘）和Outpaint（扩展绘制，可向上下左右四个方向扩展）。采用自研的算法和模型，在处理效果上优于标准SDXL方法，能更精准地实现用户的局部修改和扩展创作需求
图片提示（Image Prompt）	运用自研算法，在结果质量和对提示词的理解方面，表现优于标准SDXL的IP-Adapters或Revisions方法，能更好地结合图片提示生成符合预期的图片
风格与参数调整	支持多种风格选择，用户可根据需求挑选合适的图片风格；同时允许调整引导力度（Guidance）、质量参数、生成图片数量、宽高比等参数，且兼容A1111的提示词权重算法，为用户提供了一定的创作灵活性
其他特色	支持人脸交换（FaceSwap）功能，可实现图片中人脸的替换；具备图片描述（Describe）功能，能对输入图片进行文本描述；还支持ControlNet等高级功能，进一步拓展了图片生成的可能性

三、技术细节

底层架构：Fooocus基于Stable Diffusion XL架构开发，Stable Diffusion XL是一种先进的文本到图片生成模型，具备强大的图片生成能力，为Fooocus的高质量图片输出提供了坚实的基础。
交互界面：采用Gradio构建交互界面，Gradio是一个开源的Python库，能够快速创建机器学习模型的演示界面，使得Fooocus的操作界面简洁直观，方便用户进行交互操作。
提示词处理：内置基于GPT-2的提示词处理引擎，GPT-2是一种大型语言模型，能够对用户输入的提示词进行理解和优化，从而更好地引导图片生成过程，提高图片与提示词的匹配度。
自研算法：在Inpaint、Outpaint、Image Prompt等功能中应用了自研算法，这些算法是开发团队针对具体功能场景进行优化设计的，相比标准方法在效果和性能上更具优势，能够提升图片生成的质量和准确性。
模型支持：支持多种预设模型，不同的预设模型适用于不同的场景，如通用、写实、动漫等。这些模型经过优化和训练，能够在相应场景下生成更符合预期的图片。同时，用户也可以手动添加自定义模型，增强了软件的扩展性。
采样优化：在图片生成过程中采用了采样优化机制，通过优化采样策略，能够提高图片生成的效率和质量，使生成的图片更加清晰、细腻。

四、应用场景

艺术创作：艺术家和设计师可以利用Fooocus进行创意绘画和艺术创作。通过输入富有想象力的提示词，快速生成各种风格的图片，为创作提供灵感和素材。例如，生成抽象风格的画作、奇幻场景的插画等，帮助艺术家突破传统创作方式的限制，拓展创作思路。
设计领域：在平面设计、产品设计、UI/UX设计等领域，Fooocus可以发挥重要作用。设计师可以通过它生成产品原型图、界面设计草图、广告创意图等。比如，为一款新产品生成不同风格的外观设计图，或者为手机应用设计不同的界面布局效果图，提高设计效率和创意多样性。
内容制作：自媒体从业者、内容创作者可以使用Fooocus制作图文内容中的配图。无论是文章中的插画、社交媒体的配图还是视频的封面图，都可以通过Fooocus快速生成，且能够根据内容主题进行定制，使内容更加生动、吸引人。
教育科研：在教育领域，教师可以利用Fooocus生成教学素材，如教材中的插图、教学演示用的图片等，帮助学生更好地理解知识点。在科研领域，研究人员可以将其用于相关图片生成算法的研究和实验，或者生成实验所需的模拟图片等。
个人娱乐：普通用户也可以将Fooocus作为一种娱乐工具，通过输入自己喜欢的提示词，生成各种有趣的图片，如自己想象中的虚拟角色、梦幻的场景等，享受AI图片生成带来的乐趣。

Fooocus：开源免费的离线AI图片生成工具，轻松实现文本到图像的创意转化

五、使用方法

Fooocus支持多平台安装使用，以下是不同平台的具体安装和启动方式：

Windows

直接在官方releases页面下载压缩包。
将压缩包解压后，找到并运行run.bat文件即可启动软件。
首次启动时，软件会自动下载默认模型。用户也可以手动将模型放入Fooocus\models\checkpoints目录下。

Linux（Anaconda）

首先通过命令git clone https://github.com/lllyasviel/Fooocus.git克隆仓库到本地。
进入仓库目录：cd Fooocus。
使用conda创建环境：conda env create -f environment.yaml。
激活环境：conda activate fooocus。
安装依赖：pip install -r requirements_versions.txt。
启动软件，启动时会自动下载模型：python entry_with_update.py。

Mac

通过终端克隆仓库：git clone https://github.com/lllyasviel/Fooocus.git。
进入仓库目录：cd Fooocus。
使用conda创建环境并安装依赖（步骤同Linux）。
运行python entry_with_update.py启动软件。需要注意的是，M2用户可能需要添加--disable-offload-from-vram参数。

Colab

使用官方提供的fooocus_colab.ipynb（https://colab.research.google.com/github/lllyasviel/Fooocus/blob/main/fooocus_colab.ipynb）。
可以通过修改启动命令切换预设（默认/动漫/写实），以满足不同的生成需求。

Docker

需先安装Docker及相关工具。
参考仓库中的docker.md文件进行配置，该配置支持持久化存储模型和输出文件，方便用户管理和使用生成的内容。

六、常见问题解答

官方是否有fooocus.com等域名的官方网站？

答：警惕伪造网站，Fooocus官方仅通过GitHub仓库提供资源，没有fooocus.com等域名的官方网站。

Fooocus对硬件有什么要求？

答：最低需要4GB Nvidia GPU显存（VRAM）和8GB系统内存（RAM）。为避免性能问题，推荐使用Nvidia 531版本驱动。

首次使用部分功能时，为什么会下载额外的模型？

答：首次使用部分功能（如Inpaint）会下载专用模型（如inpaint_v26.fooocus.patch），这是为了保证这些功能的正常运行和生成效果，需保证网络畅通以便顺利下载。

启动软件时出现模型下载失败的情况该怎么办？

答：首先检查网络连接是否正常，确保网络畅通。若网络正常仍下载失败，可以尝试手动下载模型，将其放入指定的模型目录（如Fooocus\models\checkpoints）。

在使用过程中，软件出现报错或崩溃怎么办？

答：首先查看报错信息，尝试根据提示解决问题。若无法解决，可以到官方GitHub仓库的issues页面搜索类似问题，看是否有解决方案。若没有，可提交新的issue，详细描述问题出现的场景、报错信息等，等待开发团队或其他用户的帮助。

如何添加自定义模型？

答：将自定义模型文件放入Fooocus\models\checkpoints目录下，重启软件后，软件会自动识别并加载该模型，用户可以在使用过程中选择该模型进行图片生成。

生成的图片保存在哪里？

答：生成的图片默认保存在软件目录下的outputs文件夹中，用户可以在软件界面中查看图片的保存路径，也可以根据自己的需求在设置中修改保存路径。

七、相关链接

GitHub仓库：https://github.com/lllyasviel/Fooocus
官方releases页面：https://github.com/lllyasviel/Fooocus/releases

八、总结

Fooocus作为一款基于Stable Diffusion XL的离线开源免费图片生成软件，凭借简化的操作流程、丰富的功能特色和稳定的性能，为用户提供了便捷高效的图片生成解决方案。它支持多平台使用，适用于艺术创作、设计、内容制作等多种场景，尽管处于有限长期支持阶段，但现有功能已能满足大部分用户的需求，是一款值得尝试的AI图片生成工具。