TaxHacker:开源自托管AI会计工具,自动化发票识别与记账管理
TaxHacker是什么
TaxHacker是一款开源、自托管的AI会计应用,由开发者vas3k打造,核心定位是为自由职业者、独立开发者和小型企业提供自动化的费用与收入跟踪解决方案。作为一款MIT许可证授权的开源工具,它将大语言模型(LLM)与光学字符识别(OCR)技术结合,用户只需上传收据、发票照片或PDF文件,AI便能自动提取金额、日期、商家、税额等关键财务信息,结构化存储为类Excel数据库,大幅减少手动记账耗时,简化税务申报流程。
该项目诞生于2026年初,开源仅3个月便在GitHub收获超3900星标,迅速成为趋势榜热门项目,核心优势在于数据自主可控、高度可定制、多模型适配,完美契合跨境从业者、隐私敏感用户及中小微企业的财务需求。

功能特色
1. AI驱动的票据智能解析
多格式兼容:支持JPG、PNG照片及PDF文件批量上传,适配印刷发票、手写收据、外文票据、模糊照片等各类场景。
全维度信息提取:自动识别并提取日期、金额(含税/不含税)、商家名称、商品明细、税率税额等核心信息,甚至可拆分发票中的单个项目为独立交易记录。
高识别准确率:收据识别准确率达85%-95%,发票识别准确率达90%-98%,支持多语言解析,解决跨境票据处理难题。
智能自动分类:基于交易内容自动归类为餐饮、交通、办公用品、差旅等预设类别,支持手动调整与规则自定义,越用越贴合用户业务逻辑。
2. 多币种(含加密货币)自动换算
全币种覆盖:支持170+种法定货币与14种主流加密货币(BTC、ETH、LTC、DOT等),满足跨境交易与数字资产记账需求。
历史汇率精准换算:自动识别票据货币类型,接入公开汇率API,按交易当日历史汇率自动转换为用户设定的基础货币,无需手动查汇率计算。
手动调整灵活适配:支持手动修改汇率与换算结果,应对特殊汇率场景,确保记账数据精准无误。
3. 高度可定制化配置
自定义分类与项目:可自由创建财务分类(如“客户回款”“办公采购”)与项目标签(如“项目A”“跨境业务”),按自身业务逻辑组织账目。
自定义字段提取:相当于在Excel中新增专属列,通过自然语言编写AI提示词,提取业务特殊信息(如“增值税专票编号”“服务起止时间”“项目编码”)。
自定义AI提示词模板:支持修改系统级提示词,调整字段提取优先级、命名规则,适配行业专属文档解析需求,全流程透明可调控。
4. 数据管理与导出
全文检索+高级筛选:按日期、金额、分类、项目、自定义字段等多维度精准筛选交易记录,快速定位目标数据。
批量操作高效便捷:支持批量修改分类、项目标签,批量导出或删除交易记录,大幅提升数据管理效率。
多格式数据导出:筛选后的数据可导出为CSV格式,支持附带原始票据文档,直接对接Excel、Notion或本地BI工具做进一步分析,满足税务申报与财务汇报需求。
5. 多AI模型灵活适配
主流云模型支持:兼容OpenAI(GPT-4o,OCR能力最强,推荐)、Google Gemini(性价比高)、Mistral(欧洲用户偏好)等主流大语言模型。
本地模型兼容:通过OpenAI兼容API端点接入本地LLM(如Ollama、LM Studio、vLLM、LocalAI),实现全程离线运行,彻底保障财务数据隐私。
成本可控灵活切换:可根据预算与需求自由切换AI模型,平衡识别准确率与使用成本。
技术细节
1. 核心技术栈
TaxHacker采用现代化技术架构,兼顾开发效率与运行性能,核心技术栈如下:
前端:基于Next.js(TypeScript) 构建,搭配TailwindCSS实现响应式UI,支持多端适配,界面简洁易用。
后端:Node.js+TypeScript开发,采用Prisma ORM对接数据库,提供稳定高效的数据读写能力,集成Sentry实现错误监控。
AI交互层:通过API对接主流LLM与本地模型,集成OCR技术实现票据文字识别,结合大语言模型语义理解能力提取结构化数据。
部署容器化:提供Dockerfile与docker-compose配置文件,支持一键容器化部署,简化环境配置流程,降低自托管门槛。
2. 系统工作流程
票据上传:用户通过Web界面上传收据、发票照片或PDF文件,系统接收并存储原始文件。
OCR文字识别:调用OCR引擎提取票据中的全部文字内容,生成文本数据。
AI语义解析:将OCR文本传入LLM,通过预设或自定义提示词,提取金额、日期、商家等关键结构化信息。
数据结构化存储:将解析后的结构化数据存入数据库,自动分类并关联原始票据文件。
多币种换算:识别交易货币类型,调用汇率API获取当日汇率,自动换算为基础货币。
数据展示与管理:用户通过Web看板查看、筛选、编辑交易数据,支持导出CSV或生成财务报告。
3. 数据安全与隐私保障
100%数据自托管:所有财务数据存储在用户自己的服务器或本地设备中,不经过任何第三方服务器,彻底规避云端数据泄露风险。
开源透明无黑盒:项目源码完全开放,可自由审计,无隐藏数据上传或隐私收集逻辑。
本地模型离线运行:对接本地LLM时,全程无需联网,敏感财务数据完全离线处理,隐私安全等级拉满。
4. 部署环境要求
最低配置:1核CPU、2GB内存、20GB存储空间,适合个人用户与微型企业。
推荐配置:2核CPU、4GB内存、50GB存储空间,支持多用户并发访问与批量票据处理。
系统支持:兼容Linux、Windows、macOS系统,支持Docker部署或直接源码运行。

应用场景
1. 自由职业者/独立开发者
痛点:收入来源分散、票据类型繁杂、跨境收款多,手动记账耗时久,报税时票据整理混乱。
适配价值:AI自动识别各类票据,多币种自动换算,自定义分类适配不同项目收入/支出,每月财务处理时间从20小时缩短至2小时以内,大幅提升工作效率。
2. 小型企业/初创团队
痛点:财务预算有限,无力承担专业会计或昂贵ERP系统,费用报销与税务申报流程繁琐。
适配价值:免费开源降低成本,自托管保障企业财务数据安全,支持多项目管理与批量数据导出,满足日常费用追踪、员工报销管理与税务申报需求。
3. 跨境电商/外贸从业者
痛点:涉及多币种交易(美元、欧元、英镑等),需手动换算汇率,票据语言多样(英文、日文、韩文等),记账难度大。
适配价值:170+种法定货币与14种加密货币全覆盖,自动识别外币并按历史汇率换算,支持多语言票据解析,完美适配跨境交易记账场景。
4. 隐私敏感型用户
痛点:不愿将敏感财务数据上传至云端SaaS工具,担心数据泄露或被第三方滥用。
适配价值:完全自托管部署,数据全程自主可控,支持本地AI模型离线处理,无任何第三方数据访问权限,彻底解决隐私顾虑。

使用方法
1. 部署准备
环境安装:确保服务器/本地设备已安装Docker与docker-compose(推荐),或安装Node.js(v18+)与PostgreSQL数据库。
源码获取:克隆GitHub仓库到本地:
git clone https://github.com/vas3k/TaxHacker.git cd TaxHacker
环境配置:复制
.env.example文件为.env,配置数据库连接信息、AI模型API密钥(如OpenAI API Key)、基础货币类型等参数:
cp .env.example .env # 编辑.env文件,填写必要配置
2. 启动部署
方式一:Docker容器化部署(推荐)
# 启动容器服务 docker-compose up -d # 查看服务运行状态 docker-compose logs -f
部署完成后,访问http://localhost:3000进入Web界面。
方式二:源码直接运行
# 安装依赖 npm install # 初始化数据库 npx prisma migrate dev # 启动开发服务 npm run dev
访问http://localhost:3000即可使用。
3. 基础使用流程
账号注册登录:首次访问注册管理员账号,登录后进入主界面。
票据上传解析:点击“上传票据”,选择收据/发票照片或PDF文件,系统自动上传并开始AI解析,等待10-30秒完成识别。
数据核对编辑:解析完成后,查看结构化数据(金额、日期、商家等),手动核对并修正错误信息,补充自定义字段内容。
分类与项目关联:为交易记录选择分类(如餐饮、办公),关联对应项目标签,便于后续筛选管理。
数据筛选导出:通过高级筛选功能查找目标交易记录,选中后导出为CSV文件,用于税务申报或Excel分析。
4. 高级配置(自定义字段+本地模型)
自定义字段创建
进入“设置-自定义字段”,点击“新增字段”。
填写字段名称(如“增值税专票编号”),选择字段类型(文本、数字、日期)。
编写AI提示词(如“提取票据中的增值税专用发票编号,无则留空”),保存配置。
后续上传票据时,AI将自动提取该字段信息并存储。
本地模型对接(以Ollama为例)
本地部署Ollama并启动服务,确保API地址可访问(默认
http://localhost:11434)。进入TaxHacker“设置-AI模型”,选择“自定义OpenAI兼容API”。
填写API地址(
http://host.docker.internal:11434/v1)、模型名称(如llama3),保存配置。切换AI模型为本地模型,后续票据解析将通过本地LLM完成,全程离线运行。

竞品对比
选取2款主流同类工具(QuickBooks、Xero)与TaxHacker进行核心维度对比,清晰展现产品差异与优势:
| 对比维度 | TaxHacker | QuickBooks(专业版) | Xero(标准版) |
|---|---|---|---|
| 部署方式 | 自托管(Docker/本地部署) | 云端SaaS(强制云端存储) | 云端SaaS(强制云端存储) |
| 软件成本 | 免费(MIT开源) | 月费$75(年$900) | 月费$30-70(年$360-840) |
| 数据隐私 | 100%自主可控,无第三方访问权限 | 云端存储,隐私协议允许数据“分析” | 云端存储,数据归属平台 |
| AI票据识别 | 支持(多格式/多语言/手写识别) | 基础支持(仅印刷发票,准确率80%) | 基础支持(仅印刷发票,准确率82%) |
| 多币种支持 | 170+法币+14种加密货币,历史汇率换算 | 100+法币,实时汇率(无历史汇率) | 160+法币,实时汇率(无历史汇率) |
| 自定义能力 | 极高(自定义字段/分类/AI提示词) | 中等(预设模板,有限自定义) | 中等(预设模板,有限自定义) |
| 本地模型适配 | 支持(Ollama/LM Studio等) | 不支持(仅云端专属模型) | 不支持(仅云端专属模型) |
| 年总成本(含运维) | 约$1,640(服务器+AI费用) | 约$9,900(软件费+隐性时间成本) | 约$5,000(软件费+隐性时间成本) |
| 适用人群 | 自由职业者/跨境从业者/隐私敏感用户 | 大型企业/专业会计团队 | 中型企业/外贸公司 |
核心优势总结:相较于QuickBooks与Xero,TaxHacker在数据隐私、自定义能力、成本控制三大维度实现全面领先,尤其适配跨境交易与隐私敏感场景,是中小微企业与自由职业者的高性价比选择。
常见问题解答
Q:TaxHacker适合完全不懂技术的人使用吗?
A:TaxHacker提供Docker一键部署方案,不懂技术的用户可参考官方文档完成部署,基础操作(票据上传、数据导出)均为可视化界面,简单易上手;但对接本地模型、自定义复杂提示词等高级操作需基础技术认知,可选择直接对接OpenAI等云端模型降低使用门槛。
Q:AI识别准确率低时该如何解决?
A:首先确保票据照片清晰、无反光、文字完整;其次可手动修正识别错误信息,系统会学习修正逻辑,提升后续识别准确率;还可优化自定义AI提示词,明确提取规则,或切换至GPT-4o等识别能力更强的AI模型。
Q:支持多人协作使用吗?
A:支持,最新版本已新增多用户权限管理功能,可创建不同权限账号(如管理员、普通员工),员工可上传票据,管理员负责审核、编辑与导出数据,满足小型团队协作需求。
Q:数据备份与迁移方便吗?
A:方便,所有数据存储在用户自主管理的数据库中,可通过数据库命令定期备份;迁移时只需导出数据库备份文件,在新服务器部署TaxHacker后导入备份文件即可,数据完整迁移无损耗。
Q:是否支持中文票据识别?
A:完全支持,TaxHacker适配中文简体、繁体票据,可精准识别中文发票、收据的金额、日期、商家名称等信息,支持中文分类与自定义字段,完美适配国内用户记账需求。
相关链接
GitHub仓库地址:https://github.com/vas3k/TaxHacker
开发者CV与求职信息:https://vas3k.com/
总结
TaxHacker作为一款开源自托管的AI会计工具,精准击中自由职业者、小型企业及跨境从业者的财务痛点,以AI票据自动化识别为核心,融合多币种换算、高度自定义配置与数据隐私保障等核心能力,打破传统云端记账工具的成本高、隐私弱、自定义差的局限,通过免费开源与灵活部署特性大幅降低财务自动化门槛,无论是个人日常记账、团队费用管理还是跨境交易核算,均能提供高效、安全、低成本的解决方案,成为中小微用户财务数字化转型的优质选择。
版权及免责申明:本文由@AI工具箱原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-news/taxhacker.html

