能力标签
智能工作流
⚙️
Agent工作流

智能工作流

基于 Python · 无代码搭建完整 AI 自动化流程
英文名:sparrow
⭐ 5.2k Stars 🍴 518 Forks 💻 Python 📄 GPL-3.0 🏷 AI 8.0分
8.0AI 综合评分
agentic-aicomputer-visiondocumentaihuggingface-transformersllmpython
✦ AI Skill Hub 推荐

智能工作流 是 AI Skill Hub 本期精选Agent工作流之一。已获得 5.2k 颗 GitHub Star,综合评分 8.0 分,整体质量较高。我们强烈推荐将其纳入你的 AI 工具库,帮助提升工作效率。

📚 深度解析

智能工作流 是一套完整的 AI Agent 自动化工作流方案。随着 AI 能力的不断提升,基于 Agent 的自动化工作流正在成为提升个人和团队效率的核心方式。区别于传统的 RPA 自动化(模拟鼠标键盘操作),AI Agent 工作流通过理解任务意图、动态规划执行路径,能够处理更复杂的非结构化任务。

智能工作流 工作流的设计遵循"最小配置,最大复用"原则:核心逻辑已经封装好,用户只需配置自己的 API Key 和业务参数即可快速上手。工作流内置错误处理和重试机制,在网络波动或 API 限速等情况下仍能稳定运行,适合作为生产环境的自动化基础设施。

在实际部署时,建议先在测试环境中运行 3-5 次,验证各个环节的输出结果符合预期,再部署到生产环境。AI Skill Hub 评分 8.0 分,是同类 Agent 工作流中的精选推荐。

📋 工具概览

智能工作流 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。

GitHub Stars
⭐ 5.2k
开发语言
Python
支持平台
Windows / macOS / Linux
维护状态
持续维护,定期更新
开源协议
GPL-3.0
AI 综合评分
8.0 分
工具类型
Agent工作流
Forks
518

📖 中文文档

以下内容由 AI Skill Hub 根据项目信息自动整理,如需查看完整原始文档请访问底部「原始来源」。

智能工作流 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。

📌 核心特色
  • 可视化 Agent 工作流编排,无需编写复杂代码
  • 支持多步骤自动化任务链,实现全流程无人值守
  • 与外部 API、数据库和第三方服务无缝集成
  • 内置错误处理与自动重试机制,保障稳定运行
  • 提供可复用的自动化模板,快速在同类场景部署
🎯 主要使用场景
  • 自动化日常重复性工作,将精力集中于创造性任务
  • 构建数据采集 → 处理 → 输出的完整自动化管线
  • 实现跨平台、跨系统的数据流转和业务协同
以下安装命令基于项目开发语言和类型自动生成,实际以官方 README 为准。
安装命令
# 方式一:pip 安装(推荐)
pip install sparrow

# 方式二:虚拟环境安装(推荐生产环境)
python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install sparrow

# 方式三:从源码安装(获取最新功能)
git clone https://github.com/katanaml/sparrow
cd sparrow
pip install -e .

# 验证安装
python -c "import sparrow; print('安装成功')"
📋 安装步骤说明
  1. 访问 GitHub 仓库获取工作流文件
  2. 在对应平台(Dify / Flowise / Make 等)中找到「导入工作流」功能
  3. 上传工作流文件
  4. 按照提示配置必要的环境变量和 API Key
  5. 运行测试确认流程正常后投入使用
以下用法示例由 AI Skill Hub 整理,涵盖最常见的使用场景。
常用命令 / 代码示例
# 命令行使用
sparrow --help

# 基本用法
sparrow input_file -o output_file

# Python 代码中调用
import sparrow

# 示例
result = sparrow.process("input")
print(result)
以下配置示例基于典型使用场景生成,具体参数请参照官方文档调整。
配置示例
# sparrow 配置文件示例(config.yml)
app:
  name: "sparrow"
  debug: false
  log_level: "INFO"

# 运行时指定配置文件
sparrow --config config.yml

# 或通过环境变量配置
export SPARROW_API_KEY="your-key"
export SPARROW_OUTPUT_DIR="./output"
📑 README 深度解析 真实文档 完整度 95/100 查看 GitHub 原文 →
以下内容由系统直接从 GitHub README 解析整理,保留代码块、表格与列表结构。

Sparrow

PyPI - Python GitHub Stars GitHub Issues Current Version License: GPL v3

Structured data extraction, instruction calling and agentic workflows with ML, LLM and Vision LLM

Sparrow is an API-first platform for enterprise document intelligence. It combines accurate structured extraction from documents (invoices, statements, tables) with workflow agents and decision agents.

<p align="center"> <img width="300" height="300" src="https://github.com/katanaml/sparrow/blob/main/sparrow-ui/assets/sparrow_logo_5.png"> </p>

<p align="center"> <strong>🚀 <a href="https://sparrow.katanaml.io">Try Sparrow Online</a> | 📖 <a href="#-quickstart">Quick Start</a> | 🛠️ <a href="#️-installation">Installation</a> | 📚 <a href="#-examples">Examples</a> | 🤖 <a href="#-sparrow-agent">Agents</a></strong> </p>

---

Sparrow UI Features

The web UI provides a visual interface on top of the same API:

  • Drag & Drop: Upload documents directly
  • Real-time Processing: See results instantly
  • Data Query: JSON based schema for data query
  • Structured Output: JSON structured output
  • Result Annotation: View bounding boxes

✨ Key Features

🎯 Universal Document Processing: Handle invoices, receipts, forms, bank statements, tables 🔧 Pluggable Architecture: Mix and match different pipelines (Sparrow Parse, Instructor, Agents) 🖥️ Multiple Backends: MLX (Apple Silicon), Ollama, vLLM, Docker, Hugging Face Cloud GPU 📱 Multi-format Support: Images (PNG, JPG) and multi-page PDFs 🎨 Schema Validation: JSON schema-based extraction with automatic validation 🌐 API-First Design: RESTful APIs for easy integration 💬 Instruction Calling: Text processing, validation, decision making with GPT-OSS, Mistral, Qwen 3.6, etc. 📊 Visual Monitoring: Built-in dashboard and agent workflow tracking 🔒 Enterprise Ready: Rate limiting, usage analytics, commercial licensing available 🚀 Local Vision LLMs: Mistral, Qwen 3.6, DeepSeek OCR, dots.ocr, Gemma 4, etc.

Features

  • Multi-step Workflows: Chain classification, extraction, and validation
  • Visual Monitoring: Real-time pipeline tracking
  • Error Handling: Robust failure recovery
  • Extensible: Custom agents for specific use cases

Features

  • Usage Analytics: Track API calls, success rates, performance
  • Geographic Distribution: See usage by country
  • Model Performance: Compare different model performance
  • Real-time Monitoring: Live processing statistics

Prerequisites

  • Python 3.12.10+ (use pyenv for version management)
  • macOS (for MLX backend) or Linux/Windows (for other backends)
  • GPU (make sure GPU have enough memory to run selected Vision LLM)

30-Second Setup

```bash

1. Install pyenv and Python 3.12.10

pyenv install 3.12.10 pyenv global 3.12.10

3. Install Sparrow Parse pipeline

git clone https://github.com/katanaml/sparrow.git cd sparrow/sparrow-ml/llm pip install -r requirements_sparrow_parse.txt

4. For macOS: Install poppler for PDF processing

brew install poppler

🛠️ Installation

Quick Setup

```bash

Test installation

python api.py --port 8002

If MLX fails to install

pip install --upgrade pip pip install mlx-vlm --no-cache-dir

bash

If pip install command throws AttributeError: 'NoneType' object has no attribute 'get'

Verify installation

pdftoppm -h


</details>

<details>
<summary>🔧 Runtime Issues</summary>

**Memory Errors:**
- Use smaller or MoE models to reduce VRAM footprint
- Enable image cropping: `--crop-size 100`
- Process single pages instead of entire PDFs

**Model Loading Fails:**
bash

🚀 Quickstart

📚 Examples

Function calling example

./sparrow.sh assistant --pipeline "stocks" --query "Oracle"


**JSON Output:**
json { "company": "Oracle Corporation", "ticker": "ORCL" }

**Additional Output:**
The stock price of the Oracle Corporation is 186.3699951171875. USD ```

💻 CLI Usage

Advanced Examples

```bash

🌐 API Usage

Usage

```bash

2. Create virtual environment

python -m venv .env_sparrow_parse source .env_sparrow_parse/bin/activate # Linux/Mac

or .env_sparrow_parse\Scripts\activate # Windows

Pipeline Options

#### Sparrow Parse (Vision LLM) ```bash

Fix with pyenv

pyenv install 3.12.10 pyenv global 3.12.10


**MLX Installation (Apple Silicon):**
bash

5. Start the API server

python api.py ```

Before running pip install -r requirements_sparrow_parse.txt, check your platform. If you are on macOS and want to run MLX backend, go to requirements_sparrow_parse.txt and make sure sparrow-parse[mlx] libary reference is defined. If you are running Sparrow on Linux/Windows, make sure to use sparrow-parse library reference, this will skip MLX related libraries.

Visit http://localhost:8002/api/v1/sparrow-llm/docs

```

API Endpoints

Document Extraction (/inference)

curl -X POST 'http://localhost:8002/api/v1/sparrow-llm/inference' \
  -H 'Content-Type: multipart/form-data' \
  -F 'query=[{"field_name":"str", "amount":0}]' \
  -F 'pipeline=sparrow-parse' \
  -F 'options=mlx,mlx-community/Qwen2.5-VL-72B-Instruct-4bit' \
  -F 'file=@document.pdf'

Text Instructions (/instruction-inference)

curl -X POST 'http://localhost:8002/api/v1/sparrow-llm/instruction-inference' \
  -H 'Content-Type: application/x-www-form-urlencoded' \
  -d 'query=instruction: analyze data, payload: {...}' \
  -d 'pipeline=sparrow-instructor' \
  -d 'options=mlx,mlx-community/Qwen3.6-35B-A3B-8bit'

API Documentation

Visit http://localhost:8002/api/v1/sparrow-llm/docs for interactive Swagger documentation.

API Documentation

Core Components

ComponentPurposeUse Case
**[Sparrow ML LLM](https://github.com/katanaml/sparrow/tree/main/sparrow-ml/llm)**Main API engineDocument processing pipelines
**[Sparrow Parse](https://github.com/katanaml/sparrow/tree/main/sparrow-data/parse)**Vision LLM libraryStructured JSON extraction
**[Sparrow Agents](https://github.com/katanaml/sparrow/tree/main/sparrow-ml/agents)**Workflow orchestrationComplex multi-step processing
**[Sparrow OCR](https://github.com/katanaml/sparrow/tree/main/sparrow-data/ocr)**Text recognitionOCR preprocessing
**[Sparrow UI](https://github.com/katanaml/sparrow/tree/main/sparrow-ui/)**Web interfaceInteractive document processing

🔧 Pipeline Comparison

FeatureSparrow ParseSparrow InstructorSparrow Agents
**Input**Documents + JSON schemaText instructionsComplex workflows
**Output**Structured JSONFree-form textMulti-step results
**Use Cases**Data extraction, formsSummarization, analysisEnterprise workflows
**Validation**Schema-basedManualCustom rules
**Complexity**SimpleMediumHigh
**Best For**Invoices, tables, formsText processingMulti-document flows

🔍 Troubleshooting

🎯 aiskill88 AI 点评 A 级 2026-06-02

sparrow是一个高质量的开源AI工作流项目,支持多种AI任务

⚡ 核心功能

👥 适合人群

自动化工程师和运维人员项目经理和业务分析师希望减少重复性工作的专业人士数字化转型团队

🎯 使用场景

  • 自动化日常重复性工作,将精力集中于创造性任务
  • 构建数据采集 → 处理 → 输出的完整自动化管线
  • 实现跨平台、跨系统的数据流转和业务协同

⚖️ 优点与不足

✅ 优点
  • +GitHub 5.2k Star,社区高度认可
  • +GPL-3.0 协议,可免费商用
  • +大幅减少重复性人工操作
  • +可视化流程,清晰直观
  • +可扩展性强,支持复杂场景
⚠️ 不足
  • 初始配置和调试需投入一定时间
  • 强依赖外部服务的稳定性
  • 复杂场景需具备一定技术基础
⚠️ 使用须知

AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。

建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。

📄 License 说明

⚠️ GPL 3.0 — 强 Copyleft,衍生作品须开源,含专利保护条款,不可闭源使用。

🔗 相关工具推荐

🧩 你可能还需要
基于当前 Skill 的能力图谱,自动补全的工具组合

❓ 常见问题 FAQ

sparrow提供了结构化数据提取功能,用户可以通过配置文件定义提取规则
💡 AI Skill Hub 点评

经综合评估,智能工作流 在Agent工作流赛道中表现稳健,质量优秀。如果你已有明确的使用需求,可以直接上手体验;如果还在评估阶段,建议对比同类工具后再做决策。

⬇️ 获取与下载
⬇ 下载源码(GPL)
⚠️ 本工具使用 GPL-3.0 协议。您可以自由下载和使用,但衍生作品必须以相同协议开源,不可商业闭源。使用前请确认符合协议要求。
📚 深入学习 智能工作流
查看分步骤安装教程和完整使用指南,快速上手这款工具
🌐 原始信息
原始名称 sparrow
原始描述 开源AI工作流:Structured data extraction, instruction calling and agentic workflows with ML, L。⭐5.2k · Python
Topics agentic-aicomputer-visiondocumentaihuggingface-transformersllmpython
GitHub https://github.com/katanaml/sparrow
License GPL-3.0
语言 Python
🔗 原始来源
🐙 GitHub 仓库  https://github.com/katanaml/sparrow 🌐 官方网站  https://sparrow.katanaml.io

收录时间:2026-06-02 · 更新时间:2026-06-02 · License:GPL-3.0 · AI Skill Hub 不对第三方内容的准确性作法律背书。