一句话生成书法字?Calligrapher 开源模型实测指南(免部署+青春版A100直连)
你是否曾为一张海报缺一个“有味道”的标题字而反复PS描边?是否想快速复刻某款手写体、印章风或赛博书法,却苦于训练LoRA耗时耗卡?现在,一个真正开箱即用的解决方案来了——Calligrapher,由蚂蚁集团与香港科技大学联合研发的开源书法生成模型,无需微调、不依赖SD生态,仅需一张风格参考图 + 一句英文文本提示,即可在算家云青春版A100上零部署直接运行。本文将带你从环境配置、模型下载到Gradio交互全流程实测,手把手跑通这个“会写字的AI书法家”。
一、模型介绍
Calligrapher 是蚂蚁集团与香港科技大学的研究团队共同开发的一个创新的基于扩散模型的框架,主要用于数字书法和设计应用中的文本图像定制与风格转换。Calligrapher可以提供个性化的文本图像定制,它允许用户使用各种风格化的图像和文本提示执行自定义。目前模型支持英文的修改,同时支持使用算家云青春版A100免部署直接调用。

以下是关于 Calligrapher 模型的详细介绍:
模型特点:
风格复现精准:能够准确还原复杂字体风格的细节,如笔画粗细、弯曲程度、装饰性元素等,实现字符级别的精确排布,提升视觉一致性。
适应性强、泛化能力好:在多个字体风格和设计场景下均表现优越,即使在未见过的参考风格或文本输入下,仍能生成高质量图像。
自动化程度高:显著减少人工操作与微调需求,极大提升字体设计效率,适用于品牌定制、广告排版、包装视觉等多种场景。在定性和定量评估中,包括用户研究在内的多项指标均优于现有模型,在无需微调的条件下,也能良好完成参考风格生成任务。
支持功能:
自由文本风格化:通过多样化风格图像和文本提示生成个性化文字。
多种参考模式:支持自参考、交叉参考和无文本参考的定制方式。
多语言支持:可进行跨多种语言的风格化文本定制。
详细信息可以参考:Calligrapher2025/Calligrapher:书法家:Freestyle 文字图片定制 Calligrapher2025/Calligrapher · Hugging Face
二、模型部署步骤
部署环境
| uibuntu | 22.04 |
|---|---|
| cuda | 12.1.1 |
| python | 3.10 |
| NVIDIA Corporation | A100 SXM4 |
模型运行所需显存较高,且只能选择单张卡,建议选择高显存卡
文档中建议Python 3.10 + PyTorch 2.5.0 + CUDA,注意版本需要相匹配
1.更新基础的软件包
查看系统版本信息
#查看系统的版本信息,包括ID(如ubuntu、centos等)、版本号、名称、版本号ID等 cat /etc/os-release

配置国内源

apt 配置阿里源

将以下内容粘贴进文件中
deb http://mirrors.aliyun.com/debian/ bullseye main non-free contrib deb-src http://mirrors.aliyun.com/debian/ bullseye main non-free contrib deb http://mirrors.aliyun.com/debian-security/ bullseye-security main deb-src http://mirrors.aliyun.com/debian-security/ bullseye-security main deb http://mirrors.aliyun.com/debian/ bullseye-updates main non-free contrib deb-src http://mirrors.aliyun.com/debian/ bullseye-updates main non-free contrib deb http://mirrors.aliyun.com/debian/ bullseye-backports main non-free contrib deb-src http://mirrors.aliyun.com/debian/ bullseye-backports main non-free contrib
2.基础Miniconda3环境
查看系统是否有 miniconda 的环境
conda -V

显示如上输出,即安装了相应环境,若没有 miniconda 的环境,通过以下方法进行安装
#下载 Miniconda 安装脚本 wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh #运行 Miniconda 安装脚本 bash Miniconda3-latest-Linux-x86_64.sh #初次安装需要激活 base 环境 source ~/.bashrc
按下回车键(enter)

输入 yes

输入 yes

安装成功如下图所示

3.创建虚拟环境
创建名为Calligrapher的虚拟环境
conda create -n Calligrapher python=3.10 -y

激活虚拟环境
conda activate Calligrapher
4.从github仓库克隆项目
输入命令克隆仓库并进入到项目之中
git clone https://github.com/Calligrapher2025/Calligrapher.git

5.安装pytorch环境

出现successfully则安装成功

6.下载模型依赖库

运行模型下载工具,自定义模型下载位置
from huggingface_hub import snapshot_download
# Download the base model FLUX.1-Fill-dev (granted access needed)
snapshot_download("black-forest-labs/FLUX.1-Fill-dev", token="your_token")
# Download SigLIP image encoder (this model can also be automatically downloaded when running the code)
snapshot_download("google/siglip-so400m-patch14-384")
# Download Calligrapher model and test data
snapshot_download("Calligrapher2025/Calligrapher")下载内容包括Calligrapher模型权重、基础模型FLUX.1-Fill-dev、SigLIP 图像编码器模型以及测试数据集

7.配置路径 path_dict.json
将路径修改为实际的存储地址
{
"data_dir": "path/to/Calligrapher_bench_testing",
"cli_save_dir": "path/to/cli_results",
"gradio_save_dir": "path/to/gradio_results",
"gradio_temp_dir": "path/to/gradio_tmp",
"base_model_path": "path/to/FLUX.1-Fill-dev",
"image_encoder_path": "path/to/siglip-so400m-patch14-384",
"calligrapher_path": "path/to/calligrapher.bin"
}三、通过gradio进行演示
下载其他缺失依赖包

访问界面
# Basic Gradio demo python gradio_demo.py

下面是Gradio演示界面

将自己选中的图片放进预选框,然后将图片放进编辑框

将图片拖入编辑框,并且选中画笔将需要修改的地方进行涂抹

输入想要修改的文字

根据需求调整

点击运行,等待过后得到结果

其他演示图



总结
Calligrapher 不仅是一个技术demo,更是字体设计工作流的一次轻量化革命:它用扩散建模实现字符级笔画控制,以SigLIP理解图像风格语义,靠FLUX.1-Fill完成高保真填充——三者协同,让“风格迁移”真正下沉为设计师可触达的日常工具。目前虽聚焦英文支持,但其架构已预留多语言扩展路径。如果你正寻找一款低门槛、高精度、强可控的文字图像生成方案,Calligrapher 值得立刻试一试。下一步,中文支持、批量生成API、移动端适配……值得共同期待。
版权及免责申明:本文来源于#算家计算,由@dotaai整理发布。如若内容造成侵权/违法违规/事实不符,请联系本站客服处理!该文章观点仅代表作者本人,不代表本站立场。本站不承担相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-tutorial/705.html

