AI Skill Hub 推荐使用:智能截图AI 是一款优质的Agent工作流。AI 综合评分 7.5 分,在同类工具中表现稳健。如果你正在寻找可靠的Agent工作流解决方案,这是一个值得深入了解的选择。
智能截图AI 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。
智能截图AI 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。
# 方式一:pip 安装(推荐)
pip install screen-flow-ai-agent
# 方式二:虚拟环境安装(推荐生产环境)
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install screen-flow-ai-agent
# 方式三:从源码安装(获取最新功能)
git clone https://github.com/zebinlu7-a11y/screen-flow-ai-agent
cd screen-flow-ai-agent
pip install -e .
# 验证安装
python -c "import screen_flow_ai_agent; print('安装成功')"
# 命令行使用
screen-flow-ai-agent --help
# 基本用法
screen-flow-ai-agent input_file -o output_file
# Python 代码中调用
import screen_flow_ai_agent
# 示例
result = screen_flow_ai_agent.process("input")
print(result)
# screen-flow-ai-agent 配置文件示例(config.yml) app: name: "screen-flow-ai-agent" debug: false log_level: "INFO" # 运行时指定配置文件 screen-flow-ai-agent --config config.yml # 或通过环境变量配置 export SCREEN_FLOW_AI_AGENT_API_KEY="your-key" export SCREEN_FLOW_AI_AGENT_OUTPUT_DIR="./output"
<p align="center"> <img src="assets/logo.png" alt="Ai_Flow" width="128" height="114"> </p>
<p align="center"> <b>截图 → AI 多模态解析 / OCR 文字识别 → 悬浮窗流式输出</b> </p>
<p align="center"> <img src="https://img.shields.io/badge/Python-3.9+-blue?logo=python" alt="Python"> <img src="https://img.shields.io/badge/UI-PyQt6-green?logo=qt" alt="PyQt6"> <img src="https://img.shields.io/badge/AI-LangGraph-orange" alt="LangGraph"> <img src="https://img.shields.io/badge/VLM-豆包VL-red" alt="豆包VL"> <img src="https://img.shields.io/badge/OCR-腾讯云-blue" alt="OCR"> <img src="https://img.shields.io/badge/跨平台-Win/Mac/Linux-lightgrey" alt="跨平台"> </p>
---
| 功能 | 说明 |
|---|---|
| 🪟 **常驻悬浮窗** | 启动即显示,可拖拽移动 + 四角缩放,半透明置顶 |
| 🔍 **连续截图** | 松手自动确认,支持多框同时提交,Ctrl+Z 撤销 |
| 🖼️ **缩略图预览** | 截图累积显示在输入框上方,可 × 单独删除 |
| 🧠 **多模态 AI** | LangGraph 状态机编排,多图 + 文字混合输入 |
| 💬 **流式输出** | 逐字打字效果,Markdown 渲染 |
| 🔄 **多轮对话** | 上下文自动管理,Token 滑窗裁剪 |
| 🔤 **OCR 识别** | 腾讯云 OCR,免费 1000 次/月 |
| 🎛️ **模型切换** | mini / lite / pro 三档随时切换 |
| ⚙️ **即时设置** | 悬浮窗底部 ⚙ 按钮,随时配置 API Key / OCR 凭证 |
| 📌 **系统托盘** | 最小化到托盘,右键菜单操作 |
| 🌍 **跨平台** | pynput 快捷键,Windows / Mac / Linux 通用 |
---
git clone https://github.com/zebinlu7-a11y/screen-flow-ai-agent.git
cd screen-flow-ai-agent
pip install -r requirements.txt
额外安装火山引擎 SDK:
pip install volcenginesdkarkruntime > 如 pip 安装失败,可从火山引擎方舟控制台下载 SDK 或联系作者获取。
python main.py
---
<img src="assets/user.png" alt="截图选区" width="300">
<img src="assets/user1.png" alt="输入追问" width="300">
<img src="assets/user2.png" alt="Ai日常对话" width="300">
Ctrl+D进入截图,拖拽画框松手自动确认变绿标号,可连续画多个框。Ctrl+Z撤销上一个。
悬浮窗常驻桌面,底部输入框随时打字对话。Ctrl+F 隐藏/显示。
<img src="assets/user3.png" alt="连续框选" width="300">
Ctrl+R进入截图,拖拽画框松手自动确认变绿标号,可连续画多个框。Ctrl+Z撤销上一个。
框选完成后 Enter 全部放入对话框,缩略图累积显示,可 ✕ 删除单张。输入文字后点"发送"统一提交。
---
启动程序后,点击悬浮窗底部 ⚙ 按钮,填写:
| 配置项 | 说明 | 获取地址 |
|---|---|---|
| API Key | 豆包方舟 API Key | [console.volcengine.com/ark/region:ark+cn-beijing/apiKey](https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey) |
| 代理地址 | HTTP 代理(如需,可不填) | 如 http://127.0.0.1:7897 |
| SecretId/Key | 腾讯云 OCR 凭证 | [console.cloud.tencent.com/cam/capi](https://console.cloud.tencent.com/cam/capi) |
OCR 凭证可选填,不填则 Ctrl+R 不可用,不影响截图 + AI 功能。
创新性的AI工作流项目
该工具未明确声明开源协议,商业使用前请联系原作者确认授权范围,避免侵权风险。
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
总体来看,智能截图AI 是一款质量良好的Agent工作流,在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态,建议收藏备用,结合自身场景选择合适时机引入使用。
| 原始名称 | screen-flow-ai-agent |
| 原始描述 | 开源AI工作流:智能截图解析悬浮窗 — 截图 + 多模态大模型 = 即时 AI 回答,基于LangGraph。⭐6 · Python |
| Topics | AI截图LangGraph |
| GitHub | https://github.com/zebinlu7-a11y/screen-flow-ai-agent |
| 语言 | Python |
收录时间:2026-06-09 · 更新时间:2026-06-09 · License:未公布 · AI Skill Hub 不对第三方内容的准确性作法律背书。
选择 Agent 类型,复制安装指令后粘贴到对应客户端