🔒 完全自托管
守护进程跑在你的 Mac 上,画面不出家门。密码 + bearer 鉴权,登录限速。
让 AI 智能体(和你的浏览器)看见并操作一台真实的 iPhone。 浏览器里 WebRTC 实时遥控;agent 用一套 HTTP API 截屏、读 UI 元素树、点按、输入 —— 中文一次到位。全程跑在你自己的 Mac 上,不经过任何第三方云。
一条命令装守护进程;再给你的 agent 装上技能,它就会自己操作手机了。
同一套 agent API,守护进程自动选最优路径 —— 快的更快,兜底永远在。
通过一个受管的桥接快捷指令直达 iOS 原生 API:电量、健康数据、定位…… 结构化 JSON 回传,最快、确定性,无需视觉。
读 iOS 自己的辅助功能树,按元素标签点按、把 Unicode 直接送进输入框 —— 不抢 Mac 光标、无坐标漂移、中文直通。人拿着手机时 agent 依然能看能操作。
基于 iPhone 镜像的屏幕流和系统级输入注入 —— 万能兜底,任何画面都能看、能点。也是人类的浏览器远程桌面(WebRTC,低延迟)。
同一台手机、同一个拼音键盘,两条路径的真实结果(均为真机记录):
三个动作就能开车:看(元素树或截图)→ 操作 → 验证。也有现成的 MCP 服务器(9 个工具)直接接 Claude。
守护进程跑在你的 Mac 上,画面不出家门。密码 + bearer 鉴权,登录限速。
VideoToolbox H.264 + WebRTC,浏览器里看手机接近原生延迟;跨网络走 Cloudflare TURN。
Claude Desktop / Claude Code 一行配置接入;npx skills add 让 agent 学会「视觉一次 → 脚本永久」。
/agent/elements 把屏幕变成元素列表 —— 推理成本骤降,标签直接拿来点按。
滚动必须是滚轮事件、镜像只收 keycode、焦点竞争、TCC 签名……每个坑都写进了文档。
稳定本地签名身份 —— 升级重装不再重新授权屏幕录制/辅助功能。