Read text from screenshots, error dialogs, and design mockups — locally and offline.
离线本地读取图片中的文字,无需 VLM、无需网络、不依赖云 API。
Reference an image file path in your prompt — seek auto-detects and OCRs it before sending to the model:
在 prompt 中引用图片文件路径:
你:修复这个 @error.png 中的错误 ↓ seek 自动检测图片引用 → OCR → 追加文字块 模型看到的:修复这个 @error.png 中的错误 [image: error.png — OCR] TypeError: Cannot read properties of undefined (reading 'map') at renderList (components/List.tsx:42) [/image: error.png]
Supported formats: .png .jpg .jpeg .webp .tiff .bmp .heic .gif
支持的图片格式:.png .jpg .jpeg .webp .tiff .bmp .heic .gif
| Platform | 平台 | Default | 默认状态 | Engine | 引擎 |
|---|---|---|---|---|---|
| macOS | ✅ On | Built-in vision_ocr (Swift + Apple Vision API), auto-compiled on first use | 内置 vision_ocr,首次自动编译 | ||
| Linux | ❌ Off | Requires ocr.command config (e.g. tesseract) | 需配置 ocr.command(如 tesseract) | ||
| Windows | ❌ Off | Requires ocr.command config | 需配置 ocr.command |
In ~/.seek/config.json:
在 ~/.seek/config.json 中:
{
"ocr": {
"enabled": true, // Override platform default
"command": "tesseract", // Custom OCR engine
"languages": "zh-Hans,en-US", // Language hint
"timeout_seconds": 15 // Per-call timeout
}
}
Design: PRD feature-image-ocr.md