Krea 2:Krea AI开源的文生图大模型,支持LoRA跨版本通用
一、Krea 2是什么
Krea 2是独立AI实验室Krea AI从零完整训练、开源发布的文本生成图像模型,该模型主打创意美学与多元风格创作,在行业测评平台Artificial Analysis的独立实验室开源文生图榜单中排名第一,是兼顾本地部署、LoRA微调、极速高清出图的开源图像生成方案。模型分为Krea 2 RAW基础底模、Krea 2 Turbo快速蒸馏版两套权重,官方标准化工作流为「RAW训练LoRA,Turbo落地推理」,LoRA权重跨版本通用,适配开发者、设计师、AI研究人员全场景使用。
二、功能特色
双模型分工体系,训练生产分离
RAW无蒸馏、可塑性极强,专门用于LoRA微调、模型二次训练;Turbo经过蒸馏压缩,仅8步即可生成高清大图,适合批量、快速出图,两套模型LoRA互通,大幅降低自定义风格开发成本。顶级原生美学表现力
原生适配插画、写实、潮流艺术、概念设计、人像、产品摄影等数十种风格,色彩层次、光影质感、画面构图表现突出,无需大量提示词优化即可产出高质量创意图像。超大分辨率支持
RAW最高原生支持1024分辨率;Turbo最高支持2048高清输出,满足海报、商业印刷、高清素材生产需求。极简本地部署,多生态兼容
采用uv包管理器一键安装依赖,原生支持ComfyUI、Fal、SGLang三大推理平台;兼容Kohya、Huggingface Diffusers、Ostris AI等主流LoRA训练工具。高度可调推理参数
开放采样步数、CFG引导、时序偏移mu、分辨率、随机种子、批量生成数量等全维度参数,适配艺术创作、稳定量产、学术实验等不同需求。宽松开源许可
基础开源权重采用社区许可,个人非商用自由使用;商用场景可联系官方采购商业授权,无严苛版权限制。

三、技术细节
1. 核心架构
项目基于MMDiT(多模态扩散Transformer) 架构开发,配套自研autoencoder自编码器完成图像压缩与重建,仓库提供mmdit.py、autoencoder.py、encoder.py完整底层代码,双流注意力机制实现文本与图像特征双向交互,提升提示词遵循度与画面细节还原能力。
2. 两大模型技术差异
| 维度 | Krea 2 RAW(基础底模) | Krea 2 Turbo(蒸馏加速版) |
|---|---|---|
| 蒸馏处理 | 无蒸馏、原生预训练权重 | 8步蒸馏压缩,移除冗余采样步骤 |
| 推荐采样步数 | 52步 | 8步 |
| CFG引导参数 | 推荐3.5,开启引导提升细节 | 推荐0.0,关闭CFG保障速度画质平衡 |
| 时序偏移mu | 分辨率动态自适应 | 固定1.15,官方最优参数 |
| 最大输出分辨率 | 1024px | 2048px |
| 核心定位 | LoRA训练、二次微调、学术研究 | 快速推理、商业批量出图、本地生产 |
3. 工程实现细节
代码语言:100% Python,仓库包含推理、采样、编码器、自编码器全套源码;
依赖管理:使用uv工具,
uv sync一键拉取全部依赖,配套pyproject.toml、uv.lock配置文件;权重格式:safetensors安全权重文件,托管于Hugging Face;
运行方式:通过环境变量
OSS_RAW、OSS_TURBO指定权重路径,执行inference.py脚本完成图像生成;采样模块:独立
sampling.py实现全套扩散采样逻辑,支持自定义采样调度。
四、应用场景
专业创意设计
插画师、概念设计师、潮流艺术家快速生成原画、海报、潮玩视觉、艺术概念稿,原生风格表现力减少后期修图工作量。AI模型二次开发
AI开发者、研究者基于RAW训练角色、风格、IP专属LoRA,训练完成后迁移至Turbo快速批量生成素材。商业素材量产
电商产品图、短视频封面、自媒体配图、广告视觉素材,使用Turbo 8步极速生成,支持2048高清商用尺寸。本地离线部署
工作室、企业私有本地AI绘图工作站,无需联网API,保障素材版权与数据安全。AI学术实验
扩散模型、LoRA微调、少步蒸馏相关研究,提供完整可修改底层代码,支持自定义训练与消融实验。可视化节点工作流
ComfyUI用户搭建自动化绘图流水线,结合ControlNet、高清修复插件实现全链路自动化创作。
五、使用方法
1. 环境部署
克隆官方仓库:
git clone https://github.com/krea-ai/krea-2进入项目目录,一键安装依赖:
uv sync前往Hugging Face下载RAW、Turbo两套safetensors权重;
配置环境变量指定权重路径:
export OSS_RAW=你的RAW权重文件路径 export OSS_TURBO=你的Turbo权重文件路径
2. RAW基础模型推理命令
适用于风格微调、精细艺术创作,完整采样流程:
uv run inference.py "a fox walking in the snow" \ --checkpoint oss_raw --steps 52 --cfg 3.5
3. Turbo极速高清推理命令
适用于批量高清商用素材,8步快速出2K图:
uv run inference.py "a fox walking in the snow" \ --checkpoint oss_turbo --steps 8 --cfg 0.0 --mu 1.15 --width 2048 --height 2048
4. 核心可调参数说明
--steps:扩散采样步数,RAW推荐52,Turbo固定8;--cfg:分类自由引导,0代表关闭,RAW推荐3.5;--mu:时序偏移系数,Turbo固定1.15效果最佳;--width/--height:输出分辨率,自动补齐16倍数;--num-images:单次批量生成图片数量;--seed:随机种子,固定种子可复现相同图像。
六、竞品对比
选取行业主流开源方案Stable Diffusion 3、Flux.1 Dev与Krea 2横向对比:
| 对比维度 | Krea 2 | Stable Diffusion 3 | Flux.1 Dev |
|---|---|---|---|
| 核心优势 | 美学质感顶尖,RAW/Turbo分工,LoRA跨版本通用,最高2048分辨率 | 文本文字渲染强,社区插件生态成熟,ControlNet适配完善 | 少步采样速度快,复杂人物、手部细节精准,提示词遵循度高 |
| 模型架构 | MMDiT双流扩散Transformer | MMDiT+修正流Rectified Flow | 单流Transformer扩散架构 |
| 蒸馏加速方案 | Turbo 8步蒸馏,独立训练底模RAW | SD3 Turbo蒸馏版本,无专用微调底模 | Schnell 4步极速模型,Dev为基础开源版 |
| LoRA适配 | RAW专用训练底模,LoRA可直接迁移Turbo | 统一权重训练,蒸馏版LoRA兼容性一般 | Dev训练LoRA,Schnell兼容度有限 |
| 最大分辨率 | Turbo支持2048px | 原生1024,超分插件实现2K | 原生1024-1792 |
| 适用人群 | 艺术创作者、LoRA开发者、本地批量生产 | 新手、插件重度使用者、电商美工 | 人物写实、复杂多主体场景创作者 |
| 开源协议 | 社区许可,商用需单独授权 | MIT宽松开源,商用无额外授权费 | Apache 2.0,非商用免费 |
七、常见问题解答(FAQ)
Q:我应该选择RAW还是Turbo模型使用?
A:如果需要训练专属LoRA、做模型微调、学术研究,选择Krea 2 RAW;如果日常快速出图、批量生成高清商用素材,直接使用Krea 2 Turbo。官方标准工作流是在RAW训练LoRA,再加载到Turbo中推理。
Q:Krea 2 Turbo仅8步采样,画质会大幅下降吗?
A:不会,Turbo经过专业蒸馏优化,在关闭CFG、mu=1.15参数下,8步输出画质接近RAW 52步效果,同时推理速度提升数倍,是速度与画质平衡的最优方案。
Q:RAW训练出来的LoRA,能直接在Turbo上使用吗?
A:可以,官方原生支持两套模型LoRA互通,无需二次转换,是该项目核心优势,大幅降低自定义风格开发成本。
Q:Krea 2支持多大分辨率输出?
A:RAW基础模型最高支持1024分辨率;Turbo蒸馏版原生支持1024~2048分辨率,分辨率会自动补齐至16的整数倍。
Q:本地运行Krea 2需要什么硬件配置?
A:推荐显存≥16G独立显卡(RTX 4090/A100等);2048分辨率Turbo推理建议24G以上显存,显存不足可降低输出分辨率运行。
Q:有哪些工具可以用来训练Krea 2 RAW的LoRA?
A:官方推荐工具包含Huggingface Diffusers、Ostris AI toolkit、Fal训练平台、Kohya(musubi tuner),全部适配RAW底模微调。
Q:除了本地Python脚本,还有哪些平台能运行Krea 2?
A:支持ComfyUI可视化节点、Fal云端推理、SGLang高性能推理引擎,三种主流部署方式,兼顾可视化操作与云端批量生产。
八、相关链接
GitHub仓库地址:https://github.com/krea-ai/krea-2
九、总结
Krea 2是Krea AI推出的一款从零训练、主打美学创作的开源文生图模型,通过RAW基础底模与Turbo蒸馏加速版的双模型差异化设计,解决了传统开源模型微调难、推理慢、分辨率上限低的痛点,凭借Artificial Analysis独立实验室榜单第一的美学表现、通用LoRA迁移机制、2048高清输出能力,适配设计师、AI开发者、科研人员等多元人群,同时兼容主流绘图与训练生态,提供完整可本地部署的开源代码与清晰标准化使用流程,是兼顾创意艺术生产与模型二次开发的一体化开源图像生成方案。
版权及免责申明:本文由@AI铺子原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-news/krea-2.html

