AI Skill Hub 强烈推荐:Unstract数据提取引擎 是一款优质的Agent工作流。已获得 6.6k 颗 GitHub Star,AI 综合评分 8.2 分,在同类工具中表现稳健。如果你正在寻找可靠的Agent工作流解决方案,这是一个值得深入了解的选择。
Unstract数据提取引擎 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。
Unstract数据提取引擎 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。
# 方式一:pip 安装(推荐)
pip install unstract
# 方式二:虚拟环境安装(推荐生产环境)
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install unstract
# 方式三:从源码安装(获取最新功能)
git clone https://github.com/Zipstack/unstract
cd unstract
pip install -e .
# 验证安装
python -c "import unstract; print('安装成功')"
# 命令行使用
unstract --help
# 基本用法
unstract input_file -o output_file
# Python 代码中调用
import unstract
# 示例
result = unstract.process("input")
print(result)
# unstract 配置文件示例(config.yml) app: name: "unstract" debug: false log_level: "INFO" # 运行时指定配置文件 unstract --config config.yml # 或通过环境变量配置 export UNSTRACT_API_KEY="your-key" export UNSTRACT_OUTPUT_DIR="./output"
Prompt Studio — Define document extraction schemas with natural language. Docs →

API Deployment — Send a document over REST API, get JSON back. Docs →

ETL Pipeline — Pull documents from a folder, process them, load to your warehouse. Docs →
MCP Server — Connect to AI agents (Claude, etc.) via Model Context Protocol. Docs →
n8n Node — Drop into existing automation workflows. Docs →
```bash
./run-platform.sh -v v0.1.0
./run-platform.sh -u
./run-platform.sh -u -v v0.2.0
./run-platform.sh -b -v v0.1.0
./run-platform.sh -b -v current
./run-platform.sh -e
./run-platform.sh -p -v v0.1.0
./run-platform.sh -p -b -v v0.1.0
./run-platform.sh -u -b -v current
./run-platform.sh -d -v v0.1.0 ```
./dev-env-cli.sh -p
Finance & Banking → | Insurance → | Healthcare → | Income Tax →
./run-platform.sh
| Task | Without Unstract | With Unstract |
|---|---|---|
| Schema definition | Write regex, build templates per vendor | Write a prompt once, handles variations |
| New document type | Days of development | Minutes in Prompt Studio |
| LLM integration | Build your own pipeline | Plug in any provider (OpenAI, Anthropic, Bedrock, Ollama) |
| Deployment | Custom infrastructure | ./run-platform.sh or managed cloud |
| Output | Unstructured text blobs | Clean JSON, ready for your database |
⭐ If Unstract helps you, star this repo!
高质量开源数据提取方案,LLM+工作流结合设计先进,6.6k星级证明市场认可度高,适合企业级应用。
该工具使用 AGPL-3.0 协议,商用场景请仔细阅读协议条款,必要时咨询法律意见。
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
⚠️ AGPL 3.0 — 最严格的 Copyleft,网络服务端使用也需开源,SaaS 使用受限。
总体来看,Unstract数据提取引擎 是一款质量优秀的Agent工作流,在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态,建议收藏备用,结合自身场景选择合适时机引入使用。
| 原始名称 | unstract |
| 原始描述 | 开源AI工作流:LLM-Driven Extraction of Unstructured Data — Built for API Deployments & ETL Pip。⭐6.6k · Python |
| Topics | 数据提取LLM工作流ETL管道文档处理API部署开源 |
| GitHub | https://github.com/Zipstack/unstract |
| License | AGPL-3.0 |
| 语言 | Python |
收录时间:2026-05-21 · 更新时间:2026-05-30 · License:AGPL-3.0 · AI Skill Hub 不对第三方内容的准确性作法律背书。
选择 Agent 类型,复制安装指令后粘贴到对应客户端