经 AI Skill Hub 精选评估,开源AI工作流:OpenKB 获评「推荐使用」。已获得 1.9k 颗 GitHub Star,这款Agent工作流在功能完整性、社区活跃度和易用性方面表现出色,AI 评分 7.5 分,适合有一定技术背景的用户使用。
OpenKB是开源的AI工作流,基于Open LLM Knowledge Base,提供了一个可扩展的知识库,支持多种AI模型和应用。它的价值在于提供了一种灵活的和可定制的AI工作流解决方案,能够帮助开发者快速构建和部署AI应用。
开源AI工作流:OpenKB 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。
OpenKB是开源的AI工作流,基于Open LLM Knowledge Base,提供了一个可扩展的知识库,支持多种AI模型和应用。它的价值在于提供了一种灵活的和可定制的AI工作流解决方案,能够帮助开发者快速构建和部署AI应用。
开源AI工作流:OpenKB 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。
# 方式一:pip 安装(推荐)
pip install openkb
# 方式二:虚拟环境安装(推荐生产环境)
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install openkb
# 方式三:从源码安装(获取最新功能)
git clone https://github.com/VectifyAI/OpenKB
cd OpenKB
pip install -e .
# 验证安装
python -c "import openkb; print('安装成功')"
# 命令行使用
openkb --help
# 基本用法
openkb input_file -o output_file
# Python 代码中调用
import openkb
# 示例
result = openkb.process("input")
print(result)
# openkb 配置文件示例(config.yml) app: name: "openkb" debug: false log_level: "INFO" # 运行时指定配置文件 openkb --config config.yml # 或通过环境变量配置 export OPENKB_API_KEY="your-key" export OPENKB_OUTPUT_DIR="./output"
<a href="https://openkb.ai"> <img src="https://docs.pageindex.ai/images/openkb.png" alt="OpenKB (by PageIndex)" /> </a>
openkb skill eval karpathy-thinking --save
pip install openkb
<details> <summary><i>Other install options</i></summary>
pip install git+https://github.com/VectifyAI/OpenKB.git
git clone https://github.com/VectifyAI/OpenKB.git
cd OpenKB
pip install -e .
</details>
| Command | Description |
|---|---|
openkb init | Initialize a new knowledge base (interactive) |
| <code>openkb add <file_or_dir_or_URL></code> | Add documents and compile to wiki. URL ingest auto-detects PDF (saved as .pdf → PageIndex / markitdown) vs HTML (trafilatura main-content extract → .md) |
| <code>openkb remove <doc></code> | Remove a document and clean up its wiki pages, images, registry, and PageIndex state (use --dry-run to preview, --keep-raw / --keep-empty-concepts to retain artifacts) |
openkb watch | Watch raw/ and auto-compile new files |
openkb lint | Run structural + knowledge health checks |
openkb list | List indexed documents and concepts |
openkb status | Show knowledge base stats |
| <code>openkb feedback ["msg"]</code> | File feedback by opening a prefilled GitHub issue (use --type bug/feature/question to tag the issue) |
```bash
OpenKB commands fall into two layers: the wiki foundation (compile + manage your knowledge) and generators (turn that wiki into useful output).
Settings are initialized by openkb init, and stored in .openkb/config.yaml:
model: gpt-5.4 # LLM model (any LiteLLM-supported provider)
language: en # Wiki output language
pageindex_threshold: 20 # PDF pages threshold for PageIndex
Model names use provider/model LiteLLM format (OpenAI models can omit the prefix):
| Provider | Model example |
|---|---|
| OpenAI | gpt-5.4 |
| Anthropic | anthropic/claude-sonnet-4-6 |
| Gemini | gemini/gemini-3.1-pro-preview |
Long documents are challenging for LLMs due to context limits, context rot, and summarization loss. PageIndex solves this with vectorless, reasoning-based retrieval — building a hierarchical tree index that lets LLMs reason over the index for context-aware retrieval.
PageIndex runs locally by default using the open-source version, with no external dependencies required.
For large or complex PDFs, PageIndex Cloud can be used to access additional capabilities, including:
Set PAGEINDEX_API_KEY in your .env to enable cloud features:
PAGEINDEX_API_KEY=your_pageindex_api_key
| Short documents | Long documents (PDF ≥ 20 pages) | |
|---|---|---|
| **Convert** | markitdown → Markdown | PageIndex → tree index + summaries |
| **Images** | Extracted inline (pymupdf) | Extracted by PageIndex |
| **LLM reads** | Full text | Document trees |
| **Result** | summary + concepts | summary + concepts |
Short docs are read in full by the LLM. Long PDFs are indexed by PageIndex into a hierarchical tree with summaries. The LLM reads the tree instead of the full text, enabling better retrieval from long documents.
| Karpathy's workflow | OpenKB | |
|---|---|---|
| Short documents | LLM reads directly | markitdown → LLM reads |
| Long documents | Context limits, context rot | PageIndex tree index |
| Supported formats | Web clipper → .md | PDF, Word, PPT, Excel, HTML, text, CSV, .md |
| Wiki compilation | LLM agent | LLM agent (same) |
| Q&A | Query over wiki | Wiki + PageIndex retrieval |
openkb query "What are the main findings?"
OpenKB是一个非常有趣和有用的开源项目,提供了一个灵活的AI工作流解决方案。它的代码质量很高,文档也很详细。然而,它可能需要一些时间来学习和掌握。
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
✅ Apache 2.0 — 宽松开源协议,可商用,需保留版权声明和 NOTICE 文件,含专利授权条款。
AI Skill Hub 点评:开源AI工作流:OpenKB 的核心功能完整,质量良好。对于自动化工程师和运维人员来说,这是一个值得纳入个人工具库的选择。建议先在非生产环境试用,再逐步推广。
| 原始名称 | OpenKB |
| Topics | workflowagentsaiknowledge-basellmragpython |
| GitHub | https://github.com/VectifyAI/OpenKB |
| License | Apache-2.0 |
| 语言 | Python |
收录时间:2026-05-24 · 更新时间:2026-05-24 · License:Apache-2.0 · AI Skill Hub 不对第三方内容的准确性作法律背书。
选择 Agent 类型,复制安装指令后粘贴到对应客户端