PhoneClaw:开源 iPhone 轻量化 AI 智能体助手,全离线运行免云端数据上传

原创 发布日期:
71

一、PhoneClaw是什么

PhoneClaw 是一款基于 iOS 平台 开源打造的全离线本地AI智能体项目,由开发者 kellyvv 开源托管于 GitHub。项目依托 Gemma 4 LiteRT-LM 端侧大模型推理能力,基于 Swift 语言与 Xcode 16 进行开发,专为 iPhone 设备量身适配,支持 iOS 17 及以上系统版本运行。

区别于传统云端AI应用,PhoneClaw 核心设计理念为隐私本地闭环,全程无需联网、不上传任何用户隐私数据,所有对话交互、图片解析、系统权限调用、语音识别等运算逻辑,均在 iPhone 设备本地完成。同时项目内置可扩展 Skill 能力系统,无需重新编译代码,仅通过编辑 Markdown 配置文件即可新增功能,是一款兼顾隐私安全、多模态交互、系统原生能力调度的轻量化端侧AI开源工具。

PhoneClaw:开源 iPhone 轻量化 AI 智能体助手,全离线运行免云端数据上传

二、功能特色

PhoneClaw 围绕端侧离线AI交互、iOS系统原生能力调度、多模态智能理解三大核心方向,打造了完备的功能体系,核心亮点如下:

  1. 全离线本地推理,极致隐私保护
    全程脱离网络环境,聊天记录、相册图片、健康数据、通讯录、日程信息等敏感内容仅留存设备本地,无云端数据上传、无第三方数据采集,从底层规避隐私泄露风险。

  2. 多模态智能交互能力
    支持文本对话、图片视觉理解、实时摄像头画面解析三大模态,可直接调用手机相册或实时拍照上传,完成图文问答、场景描述、图表解读、内容分析等操作。

  3. 可自定义Skill技能扩展
    内置轻量化 Skill 机制,基于 SKILL.md Markdown 文件配置管理功能,开发者和普通用户均可自行增删修改技能,无需改动源码、无需重新编译项目,扩展门槛极低。

  4. iOS原生系统深度调度
    深度适配苹果系统原生API,可自主调用手机自带核心功能:日历提醒创建、通讯录增删改查与自动去重、剪贴板跨应用中转、HealthKit健康数据读取分析等。

  5. LIVE实时流式语音交互
    搭载实时语音对话模式,支持语音实时输入、AI流式语音回复,可随时打断对话交互;结合摄像头实现实时视觉语音解读,所见即所得,交互体验更贴近真人对话。

  6. 推理模式灵活切换
    支持 GPU/CPU 双推理引擎自由切换,适配不同机型硬件性能;内置内存优化策略,降低老旧iPhone设备运行卡顿、闪退问题。

  7. 模型便捷下载与双语适配
    提供模型断点续传、后台下载功能,接入国内 ModelScope 镜像源,无需科学上网即可快速拉取模型;UI界面、提示词、技能文案、权限说明中英文双语自动适配

  8. 会话管理与解码加速
    支持历史会话记录保存与回溯,内置 MTP 推测解码技术,大幅缩短短文本问答回复延迟,提升交互响应速度。

三、技术细节

3.1 开发与运行环境

  • 开发语言:Swift

  • 编译工具:Xcode 16

  • 依赖管理:CocoaPods

  • 适配系统:iOS 17 及以上版本

  • 适配机型:A16芯片及以上iPhone机型,支持Gemma 4 E2B轻量版模型;iPhone 15 Pro及以上机型完美兼容Gemma 4 E4B完整版模型。

3.2 核心模型架构

底层搭载 Gemma 4 LiteRT-LM 轻量化端侧大模型,专为移动设备做性能裁剪与功耗优化,适配iPhone移动端算力限制,平衡推理速度与智能问答精度。模型分为两个版本:

  • Gemma 4 E2B:轻量精简版,适配A16及以上中端iPhone机型,占用内存低、运行流畅。

  • Gemma 4 E4B:完整功能版,仅支持iPhone 15 Pro及以上高端机型,多模态理解、复杂逻辑推理能力更强。

3.3 核心技术模块

  1. 端侧离线推理引擎
    集成LiteRT端侧推理框架,实现模型本地加载、运算、解码,不依赖云端API接口,所有算力本地化消耗。

  2. Skill配置解析模块
    内置Markdown解析引擎,自动读取 SKILL.md 配置文件,动态加载自定义技能,实现功能免编译热更新。

  3. iOS系统权限调度模块
    封装苹果原生框架:HealthKit健康框架、EventKit日历提醒框架、Contacts通讯录框架、AVFoundation音视频框架,实现系统能力无缝调用。

  4. 语音与视觉处理模块
    集成本地ASR语音识别、TTS语音合成能力,搭配摄像头实时流解析算法,支撑LIVE语音视觉交互。

  5. 下载与内存管理模块
    实现模型断点续传、后台静默下载逻辑;加入内存回收机制,GPU/CPU调度智能分配,控制APP后台运存占用。

3.4 项目部署方式

提供两种主流部署安装方案,适配普通用户与开发者:

1. 空壳在线安装:安装IPA空壳应用后,在iPhone端内在线下载对应大模型,占用安装包体积小,新手推荐。
2. 编译内置安装:通过Xcode编译项目,将模型文件直接嵌入APP安装包,无需后续额外下载,适合长期本地使用。

四、应用场景

  1. 隐私安全日常AI问答
    适合有隐私顾虑的用户,日常生活咨询、知识问答、文案创作均本地完成,避免对话数据被云端平台采集。

  2. 移动端多模态图文解析
    外出拍照解析景物、识别文档内容、解读图表数据、翻译图片文字,无网络环境下也可离线使用。

  3. 手机系统智能自动化管理
    通过自然语言指令创建日程提醒、整理通讯录、查看每日心率/步数/睡眠等健康数据,简化手机操作流程。

  4. 无网络环境应急使用
    户外露营、偏远地区、飞行模式等无网络场景,依旧可使用AI对话、语音交互、图片解读全部功能。

  5. 开发者二次开发与定制
    开发者可基于开源源码,自定义新增Skill技能,集成到个人iOS工具、办公助手、小众效率APP中,快速搭建端侧AI能力。

  6. 双语离线翻译交互
    依托内置双语模型与剪贴板能力,实现跨应用文本离线互译,日常出行、学习无需联网翻译软件。

PhoneClaw:开源 iPhone 轻量化 AI 智能体助手,全离线运行免云端数据上传

五、使用方法

5.1 前期准备

  1. 准备 macOS 电脑,安装 Xcode 16 与 CocoaPods 环境。

  2. 准备可用 Apple ID 账号,用于APP签名安装至iPhone。

  3. 确保iPhone升级至 iOS 17及以上 系统,预留足够存储空间用于存放模型文件。

5.2 项目克隆与依赖安装

打开终端,执行以下命令克隆源码并安装依赖:

git clone https://github.com/kellyvv/PhoneClaw.git
cd PhoneClaw
pod install

5.3 编译与安装

  1. 使用 Xcode 16 打开项目 .xcworkspace 工程文件。

  2. 在项目配置中绑定个人Apple ID,完成签名配置。

  3. 连接iPhone设备,选择对应机型,点击编译运行,自动安装APP至手机。

5.4 首次使用配置

  1. 打开PhoneClaw,按需授予日历、通讯录、健康、摄像头、麦克风权限。

  2. 选择对应机型适配的Gemma模型版本,通过国内镜像源下载模型。

  3. 可默认使用内置Skill技能,也可自行编辑 SKILL.md 新增自定义功能。

  4. 支持直接文本输入、拍照提问、开启LIVE语音模式三种交互方式。

六、竞品对比

选取2款同类型iPhone端侧离线AI工具做横向对比,从核心特性、联网要求、系统调度、自定义能力、适配机型五个维度进行对比:

对比维度 PhoneClaw 苹果原生智能助手 离线AI聊天工具(Llama移动端版)
运行模式 全离线本地推理,无任何数据上传 部分功能云端联网,隐私数据部分同步iCloud 纯文本离线推理,无系统权限调度
iOS原生能力调度 支持日历、通讯录、健康、剪贴板深度调用 仅支持基础系统指令,开放自定义程度低 不支持任何iOS原生系统API调度
功能自定义 Markdown配置免编译新增技能,门槛低 无自定义扩展入口,功能固定 仅支持更换模型,无技能自定义机制
多模态能力 文本+图片+实时摄像头视觉+语音全模态 仅支持文本与基础语音,无图片离线解析 仅文本对话,无视觉多模态能力
适配机型 iOS17+,A16及以上全机型兼容 全iOS机型适配,无硬件限制 仅高端机型流畅运行,低配机型卡顿严重

七、常见问题解答

Q:PhoneClaw 必须联网才能使用吗?

A:不需要。核心对话、图片解析、语音交互、系统功能调度均可完全离线运行,仅首次下载大模型时可选择联网,模型下载后全程无需网络。

Q:低版本iOS可以安装使用吗?

A:不可以,项目强制要求设备系统为 iOS 17 及以上,低版本系统无法兼容Xcode编译架构与端侧推理框架。

Q:非开发者没有Mac电脑,能否安装?

A:可以。可使用Sideloadly等侧载工具,加载项目未签名IPA安装包,搭配Apple ID即可在Windows电脑上侧载安装,无需Xcode编译。

Q:模型占用存储空间大吗?

A:Gemma 4 E2B轻量版占用空间较小,适合普通机型;E4B完整版体积偏大,建议预留5GB以上存储空间避免安装失败。

Q:自定义Skill技能需要编程基础吗?

A:不需要。技能基于Markdown格式编写,只需按照官方配置模板修改文字描述与指令规则,即可新增功能,无需编写代码。

Q:使用过程中会出现手机发热、耗电过快吗?

A:高负载多模态解析时会有轻微发热,项目内置GPU/CPU调度优化,日常文本问答功耗控制良好,正常使用不会出现异常耗电。

八、相关链接

九、总结

PhoneClaw 是面向iPhone用户与iOS开发者打造的开源离线AI智能体,以隐私本地化为核心核心优势,整合端侧大模型推理、多模态交互、iOS原生系统能力调度三大核心能力,凭借免编译的Markdown技能扩展机制、GPU与CPU双推理适配、国内镜像模型下载等实用设计,既满足普通用户对隐私安全AI交互、离线图文解析、手机智能管理的日常需求,也为开发者提供了轻量化二次开发框架,无需从零搭建端侧AI底层架构,即可快速定制专属iOS智能助手,是目前iOS平台兼具实用性、开源性与隐私性的优质端侧AI项目。

打赏
THE END
作者头像
人工智能研究所
发现AI神器,探索AI技术!