PhoneClaw:开源 iPhone 轻量化 AI 智能体助手,全离线运行免云端数据上传
一、PhoneClaw是什么
PhoneClaw 是一款基于 iOS 平台 开源打造的全离线本地AI智能体项目,由开发者 kellyvv 开源托管于 GitHub。项目依托 Gemma 4 LiteRT-LM 端侧大模型推理能力,基于 Swift 语言与 Xcode 16 进行开发,专为 iPhone 设备量身适配,支持 iOS 17 及以上系统版本运行。
区别于传统云端AI应用,PhoneClaw 核心设计理念为隐私本地闭环,全程无需联网、不上传任何用户隐私数据,所有对话交互、图片解析、系统权限调用、语音识别等运算逻辑,均在 iPhone 设备本地完成。同时项目内置可扩展 Skill 能力系统,无需重新编译代码,仅通过编辑 Markdown 配置文件即可新增功能,是一款兼顾隐私安全、多模态交互、系统原生能力调度的轻量化端侧AI开源工具。

二、功能特色
PhoneClaw 围绕端侧离线AI交互、iOS系统原生能力调度、多模态智能理解三大核心方向,打造了完备的功能体系,核心亮点如下:
全离线本地推理,极致隐私保护
全程脱离网络环境,聊天记录、相册图片、健康数据、通讯录、日程信息等敏感内容仅留存设备本地,无云端数据上传、无第三方数据采集,从底层规避隐私泄露风险。多模态智能交互能力
支持文本对话、图片视觉理解、实时摄像头画面解析三大模态,可直接调用手机相册或实时拍照上传,完成图文问答、场景描述、图表解读、内容分析等操作。可自定义Skill技能扩展
内置轻量化 Skill 机制,基于SKILL.mdMarkdown 文件配置管理功能,开发者和普通用户均可自行增删修改技能,无需改动源码、无需重新编译项目,扩展门槛极低。iOS原生系统深度调度
深度适配苹果系统原生API,可自主调用手机自带核心功能:日历提醒创建、通讯录增删改查与自动去重、剪贴板跨应用中转、HealthKit健康数据读取分析等。LIVE实时流式语音交互
搭载实时语音对话模式,支持语音实时输入、AI流式语音回复,可随时打断对话交互;结合摄像头实现实时视觉语音解读,所见即所得,交互体验更贴近真人对话。推理模式灵活切换
支持 GPU/CPU 双推理引擎自由切换,适配不同机型硬件性能;内置内存优化策略,降低老旧iPhone设备运行卡顿、闪退问题。模型便捷下载与双语适配
提供模型断点续传、后台下载功能,接入国内 ModelScope 镜像源,无需科学上网即可快速拉取模型;UI界面、提示词、技能文案、权限说明中英文双语自动适配。会话管理与解码加速
支持历史会话记录保存与回溯,内置 MTP 推测解码技术,大幅缩短短文本问答回复延迟,提升交互响应速度。
三、技术细节
3.1 开发与运行环境
开发语言:Swift
编译工具:Xcode 16
依赖管理:CocoaPods
适配系统:iOS 17 及以上版本
适配机型:A16芯片及以上iPhone机型,支持Gemma 4 E2B轻量版模型;iPhone 15 Pro及以上机型完美兼容Gemma 4 E4B完整版模型。
3.2 核心模型架构
底层搭载 Gemma 4 LiteRT-LM 轻量化端侧大模型,专为移动设备做性能裁剪与功耗优化,适配iPhone移动端算力限制,平衡推理速度与智能问答精度。模型分为两个版本:
Gemma 4 E2B:轻量精简版,适配A16及以上中端iPhone机型,占用内存低、运行流畅。
Gemma 4 E4B:完整功能版,仅支持iPhone 15 Pro及以上高端机型,多模态理解、复杂逻辑推理能力更强。
3.3 核心技术模块
端侧离线推理引擎
集成LiteRT端侧推理框架,实现模型本地加载、运算、解码,不依赖云端API接口,所有算力本地化消耗。Skill配置解析模块
内置Markdown解析引擎,自动读取SKILL.md配置文件,动态加载自定义技能,实现功能免编译热更新。iOS系统权限调度模块
封装苹果原生框架:HealthKit健康框架、EventKit日历提醒框架、Contacts通讯录框架、AVFoundation音视频框架,实现系统能力无缝调用。语音与视觉处理模块
集成本地ASR语音识别、TTS语音合成能力,搭配摄像头实时流解析算法,支撑LIVE语音视觉交互。下载与内存管理模块
实现模型断点续传、后台静默下载逻辑;加入内存回收机制,GPU/CPU调度智能分配,控制APP后台运存占用。
3.4 项目部署方式
提供两种主流部署安装方案,适配普通用户与开发者:
1. 空壳在线安装:安装IPA空壳应用后,在iPhone端内在线下载对应大模型,占用安装包体积小,新手推荐。 2. 编译内置安装:通过Xcode编译项目,将模型文件直接嵌入APP安装包,无需后续额外下载,适合长期本地使用。
四、应用场景
隐私安全日常AI问答
适合有隐私顾虑的用户,日常生活咨询、知识问答、文案创作均本地完成,避免对话数据被云端平台采集。移动端多模态图文解析
外出拍照解析景物、识别文档内容、解读图表数据、翻译图片文字,无网络环境下也可离线使用。手机系统智能自动化管理
通过自然语言指令创建日程提醒、整理通讯录、查看每日心率/步数/睡眠等健康数据,简化手机操作流程。无网络环境应急使用
户外露营、偏远地区、飞行模式等无网络场景,依旧可使用AI对话、语音交互、图片解读全部功能。开发者二次开发与定制
开发者可基于开源源码,自定义新增Skill技能,集成到个人iOS工具、办公助手、小众效率APP中,快速搭建端侧AI能力。双语离线翻译交互
依托内置双语模型与剪贴板能力,实现跨应用文本离线互译,日常出行、学习无需联网翻译软件。

五、使用方法
5.1 前期准备
准备 macOS 电脑,安装 Xcode 16 与 CocoaPods 环境。
准备可用 Apple ID 账号,用于APP签名安装至iPhone。
确保iPhone升级至 iOS 17及以上 系统,预留足够存储空间用于存放模型文件。
5.2 项目克隆与依赖安装
打开终端,执行以下命令克隆源码并安装依赖:
git clone https://github.com/kellyvv/PhoneClaw.git cd PhoneClaw pod install
5.3 编译与安装
使用 Xcode 16 打开项目
.xcworkspace工程文件。在项目配置中绑定个人Apple ID,完成签名配置。
连接iPhone设备,选择对应机型,点击编译运行,自动安装APP至手机。
5.4 首次使用配置
打开PhoneClaw,按需授予日历、通讯录、健康、摄像头、麦克风权限。
选择对应机型适配的Gemma模型版本,通过国内镜像源下载模型。
可默认使用内置Skill技能,也可自行编辑
SKILL.md新增自定义功能。支持直接文本输入、拍照提问、开启LIVE语音模式三种交互方式。
六、竞品对比
选取2款同类型iPhone端侧离线AI工具做横向对比,从核心特性、联网要求、系统调度、自定义能力、适配机型五个维度进行对比:
| 对比维度 | PhoneClaw | 苹果原生智能助手 | 离线AI聊天工具(Llama移动端版) |
|---|---|---|---|
| 运行模式 | 全离线本地推理,无任何数据上传 | 部分功能云端联网,隐私数据部分同步iCloud | 纯文本离线推理,无系统权限调度 |
| iOS原生能力调度 | 支持日历、通讯录、健康、剪贴板深度调用 | 仅支持基础系统指令,开放自定义程度低 | 不支持任何iOS原生系统API调度 |
| 功能自定义 | Markdown配置免编译新增技能,门槛低 | 无自定义扩展入口,功能固定 | 仅支持更换模型,无技能自定义机制 |
| 多模态能力 | 文本+图片+实时摄像头视觉+语音全模态 | 仅支持文本与基础语音,无图片离线解析 | 仅文本对话,无视觉多模态能力 |
| 适配机型 | iOS17+,A16及以上全机型兼容 | 全iOS机型适配,无硬件限制 | 仅高端机型流畅运行,低配机型卡顿严重 |
七、常见问题解答
Q:PhoneClaw 必须联网才能使用吗?
A:不需要。核心对话、图片解析、语音交互、系统功能调度均可完全离线运行,仅首次下载大模型时可选择联网,模型下载后全程无需网络。
Q:低版本iOS可以安装使用吗?
A:不可以,项目强制要求设备系统为 iOS 17 及以上,低版本系统无法兼容Xcode编译架构与端侧推理框架。
Q:非开发者没有Mac电脑,能否安装?
A:可以。可使用Sideloadly等侧载工具,加载项目未签名IPA安装包,搭配Apple ID即可在Windows电脑上侧载安装,无需Xcode编译。
Q:模型占用存储空间大吗?
A:Gemma 4 E2B轻量版占用空间较小,适合普通机型;E4B完整版体积偏大,建议预留5GB以上存储空间避免安装失败。
Q:自定义Skill技能需要编程基础吗?
A:不需要。技能基于Markdown格式编写,只需按照官方配置模板修改文字描述与指令规则,即可新增功能,无需编写代码。
Q:使用过程中会出现手机发热、耗电过快吗?
A:高负载多模态解析时会有轻微发热,项目内置GPU/CPU调度优化,日常文本问答功耗控制良好,正常使用不会出现异常耗电。
八、相关链接
模型下载:
九、总结
PhoneClaw 是面向iPhone用户与iOS开发者打造的开源离线AI智能体,以隐私本地化为核心核心优势,整合端侧大模型推理、多模态交互、iOS原生系统能力调度三大核心能力,凭借免编译的Markdown技能扩展机制、GPU与CPU双推理适配、国内镜像模型下载等实用设计,既满足普通用户对隐私安全AI交互、离线图文解析、手机智能管理的日常需求,也为开发者提供了轻量化二次开发框架,无需从零搭建端侧AI底层架构,即可快速定制专属iOS智能助手,是目前iOS平台兼具实用性、开源性与隐私性的优质端侧AI项目。
版权及免责申明:本文由@人工智能研究所原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-news/phoneclaw.html

