能力标签
Haiku RAG智能检索系统
🔌
MCP工具

Haiku RAG智能检索系统

基于 Python · 让 AI 助手直接操作你的系统与工具
英文名:haiku-rag
⭐ 527 Stars 🍴 35 Forks 💻 Python 📄 MIT 🏷 AI 8.2分
8.2AI 综合评分
RAG向量数据库文档解析智能体MCP服务
✦ AI Skill Hub 推荐

经 AI Skill Hub 精选评估,Haiku RAG智能检索系统 获评「强烈推荐」。这款MCP工具在功能完整性、社区活跃度和易用性方面表现出色,AI 评分 8.2 分,适合有一定技术背景的用户使用。

📚 深度解析

Haiku RAG智能检索系统 是一款基于 MCP(Model Context Protocol)标准协议的 AI 工具扩展。MCP 协议由 Anthropic 开发并开源,旨在建立 AI 模型与外部工具之间的标准化通信接口,目前已被 Claude Desktop、Claude Code、Cursor 等主流 AI 工具采纳。

通过安装 Haiku RAG智能检索系统,你的 AI 助手将获得额外的工具调用能力,可以用自然语言直接操控该工具的功能,无需学习复杂的命令行语法。MCP 工具的核心价值在于"一次配置,永久增强"——配置完成后,每次与 AI 对话时都可以无缝调用这些工具。

在技术实现上,MCP 工具通过标准的 JSON-RPC 协议与 AI 客户端通信,工具的功能以"工具列表"的形式暴露给 AI 模型,AI 可以按需调用。Haiku RAG智能检索系统 提供了结构化的工具调用接口,使 AI 模型能够精确地理解和使用每个功能点,显著降低 AI 在工具使用上的错误率。

与传统的 API 集成相比,MCP 工具的优势在于无需编写代码——用户只需在配置文件中添加几行 JSON,即可让 AI 获得全新能力。AI Skill Hub 将 Haiku RAG智能检索系统 评为 AI 评分 8.2 分,属于同类工具中的优质选择。

📋 工具概览

基于LanceDB、Pydantic AI和Docling的开源MCP工具,提供意见性的智能体RAG能力。支持文档解析、向量检索和多模态数据处理,适合需要构建智能知识库和问答系统的开发者。

Haiku RAG智能检索系统 是一款遵循 MCP(Model Context Protocol)标准协议的 AI 工具扩展。通过 MCP 协议,它可以让 Claude、Cursor 等主流 AI 客户端直接访问和操作外部工具、数据源和服务,实现 AI 能力的无缝扩展。无论是文件操作、数据库查询还是 API 调用,都可以通过自然语言在 AI 对话中直接触发,极大提升生产效率。

GitHub Stars
⭐ 527
开发语言
Python
支持平台
Windows / macOS / Linux
维护状态
正常维护,社区驱动
开源协议
MIT
AI 综合评分
8.2 分
工具类型
MCP工具
Forks
35

📖 中文文档

以下内容由 AI Skill Hub 根据项目信息自动整理,如需查看完整原始文档请访问底部「原始来源」。

基于LanceDB、Pydantic AI和Docling的开源MCP工具,提供意见性的智能体RAG能力。支持文档解析、向量检索和多模态数据处理,适合需要构建智能知识库和问答系统的开发者。

Haiku RAG智能检索系统 是一款遵循 MCP(Model Context Protocol)标准协议的 AI 工具扩展。通过 MCP 协议,它可以让 Claude、Cursor 等主流 AI 客户端直接访问和操作外部工具、数据源和服务,实现 AI 能力的无缝扩展。无论是文件操作、数据库查询还是 API 调用,都可以通过自然语言在 AI 对话中直接触发,极大提升生产效率。

📌 核心特色
  • 通过标准 MCP 协议与 Claude、Cursor 等主流 AI 客户端深度集成
  • 提供结构化工具调用接口,显著降低 AI 集成复杂度
  • 支持 Claude Desktop 和 Claude Code 无缝接入,开箱即用
  • 可与其他 MCP 工具组合叠加,构建完整 AI 工作站
  • 轻量无侵入设计,不影响现有系统架构
🎯 主要使用场景
  • 在 Claude Desktop 对话中直接调用本地工具,实现 AI 与系统的深度联动
  • 通过自然语言驱动复杂的多步骤自动化任务,代替繁琐手动操作
  • 将多个 MCP 工具组合使用,构建个人专属 AI 工作站
以下安装命令基于项目开发语言和类型自动生成,实际以官方 README 为准。
安装命令
# 方式一:通过 Claude Code CLI 一键安装
claude skill install https://github.com/ggozad/haiku.rag

# 方式二:手动配置 claude_desktop_config.json
{
  "mcpServers": {
    "haiku-rag------": {
      "command": "npx",
      "args": ["-y", "haiku.rag"]
    }
  }
}

# 配置文件位置
# macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
# Windows: %APPDATA%/Claude/claude_desktop_config.json
📋 安装步骤说明
  1. 确认已安装 Node.js(v18 或以上版本)
  2. 打开 Claude Desktop 或 Claude Code 的 MCP 配置文件
  3. 按「交给 Agent 安装 → Claude Desktop」标签中的 JSON 配置填入 mcpServers 字段
  4. 保存配置文件并重启 Claude 客户端
  5. 重启后,在对话中即可使用本工具
以下用法示例由 AI Skill Hub 整理,涵盖最常见的使用场景。
常用命令 / 代码示例
# 安装后在 Claude 对话中直接使用
# 示例:
用户: 请帮我用 Haiku RAG智能检索系统 执行以下任务...
Claude: [自动调用 Haiku RAG智能检索系统 MCP 工具处理请求]

# 查看可用工具列表
# 在 Claude 中输入:"列出所有可用的 MCP 工具"
以下配置示例基于典型使用场景生成,具体参数请参照官方文档调整。
配置示例
// claude_desktop_config.json 配置示例
{
  "mcpServers": {
    "haiku_rag______": {
      "command": "npx",
      "args": ["-y", "haiku.rag"],
      "env": {
        // "API_KEY": "your-api-key-here"
      }
    }
  }
}

// 保存后重启 Claude Desktop 生效
📑 README 深度解析 真实文档 完整度 78/100 查看 GitHub 原文 →
以下内容由系统直接从 GitHub README 解析整理,保留代码块、表格与列表结构。

Haiku RAG

Tests codecov

Agentic RAG built on LanceDB, Pydantic AI, and Docling.

New: vision and multimodal search. Picture-aware ingestion captures embedded figure bytes; vision-capable QA models receive them alongside text. Multimodal embedders put picture vectors in the same space as text, enabling text-as-query → figure hits and image-as-query retrieval.

Features

  • Hybrid search — Vector + full-text with Reciprocal Rank Fusion
  • Multimodal & cross-modal search — Multimodal embedders (vLLM) put picture vectors in the same space as text; supports text-as-query → figure hits and image-as-query
  • Question answering — RAG skill with citations (page numbers, section headings)
  • Vision QA — Vision-capable models receive figure bytes alongside chunk text
  • Reranking — MxBAI, Cohere, Zero Entropy, or vLLM
  • Analysis skill — Complex analytical tasks via sandboxed Python code execution (aggregation, computation, multi-document analysis)
  • Conversational RAG — Chat TUI and web application for multi-turn conversations with session memory
  • Document structure — Stores full DoclingDocument, enabling structure-aware context expansion
  • Multiple providers — Embeddings: Ollama, OpenAI, VoyageAI, LM Studio, vLLM (multimodal). QA: any model supported by Pydantic AI
  • Local-first — Embedded LanceDB, no servers required. Also supports S3, GCS, Azure, and LanceDB Cloud
  • CLI & Python API — Full functionality from command line or code
  • MCP server — Expose as tools for AI assistants (Claude Desktop, etc.)
  • Visual grounding — View chunks highlighted on original page images
  • File monitoring — Watch directories and auto-index on changes
  • Time travel — Query the database at any historical point with --before
  • Inspector — TUI for browsing documents, chunks, and search results

Slim Package (Minimal Dependencies)

pip install haiku.rag-slim

Install only the extras you need. See the Installation documentation for available options.

Installation

Python 3.12 or newer required

Quick Start

Note: Requires an embedding provider (Ollama, OpenAI, etc.). See the Tutorial for setup instructions.

```bash

Examples

See the examples directory for working examples:

  • Docker Setup - Complete Docker deployment with file monitoring and MCP server
  • Web Application - Full-stack conversational RAG with CopilotKit frontend

Python API

from haiku.rag.client import HaikuRAG

async with HaikuRAG("knowledge.lancedb", create=True) as rag:
    # Index documents
    await rag.create_document_from_source("paper.pdf")
    await rag.create_document_from_source("https://arxiv.org/pdf/1706.03762")

    # Search — returns chunks with provenance
    results = await rag.search("self-attention")
    for result in results:
        print(f"{result.score:.2f} | p.{result.page_numbers} | {result.content[:100]}")

    # QA with citations
    answer, citations = await rag.ask("What is the complexity of self-attention?")
    print(answer)
    for cite in citations:
        print(f"  [{cite.chunk_id}] p.{cite.page_numbers}: {cite.content[:80]}")

For details on the skills the client wraps, see the Skills docs.

Ask questions with citations

haiku-rag ask "What datasets were used for evaluation?" --cite

🇨🇳 中文文档镜像 AI 翻译 2026-06-02
英文原文章节由系统翻译为中文摘要,便于快速理解。完整原文见上方 "📑 README 深度解析"。
📌 简介

Haiku RAG 是一个基于 LanceDB、Pydantic AI 和 Docling 构建的 Agentic RAG 系统。它旨在为开发者提供强大的检索增强生成能力,通过结合先进的向量数据库与智能 Agent 框架,实现高度自动化且具备推理能力的文档检索与问答流程。

⚡ 功能介绍

本项目具备强大的检索与问答能力:支持结合向量与全文检索的 Hybrid search(通过 Reciprocal Rank Fusion 算法优化结果);支持 Multimodal 与 cross-modal 检索,利用 vLLM 实现图文向量对齐,支持以文搜图或以图搜文;问答系统支持带引用的 Question answering,可精准定位页码与章节;同时具备 Vision QA 能力,允许视觉模型直接处理图像字节。

📋 环境依赖

使用本项目需要 Python 3.12 或更高版本。为了保持环境轻量化,我们提供了 Slim Package(通过 `pip install haiku.rag-slim` 安装),允许开发者根据实际需求仅安装必要的依赖项,避免冗余组件占用资源。

🛠 安装步骤(Docker/pip/源码)

安装方式灵活多样。对于追求完整功能的开发者,推荐使用 `pip install haiku.rag` 或通过 `uv pip install haiku.rag` 进行安装。此外,项目也支持通过 Docker 进行快速部署,特别是在需要集成文件监控与 MCP server 的复杂场景下,Docker 是理想的选择。

🚀 使用教程

快速上手指南:在使用前,请务必配置好 Embedding provider(如 Ollama 或 OpenAI 等)。您可以参考官方 Tutorial 进行环境初始化。项目提供了丰富的 Examples 目录,包含基于 Docker 的完整部署方案,以及集成 CopilotKit 前端的 Full-stack Web Application 示例,方便开发者快速构建对话式 RAG 应用。

🔌 API 说明

Haiku RAG 提供了简洁的 Python API。开发者可以通过 `HaikuRAG` 异步上下文管理器轻松管理本地 LanceDB 索引。支持从本地文件或 URL 自动创建文档索引(create_document_from_source),并在搜索时返回带有来源证明(provenance)的文本块,确保检索结果的可追溯性。

🔄 工作流/模块

推荐安装 Full Package(`pip install haiku.rag`),该版本包含了完整的工作流模块:从文档处理(Document processing)到各类 Embedding providers 以及 Rerankers 重排序器,能够实现从原始文档摄取到最终智能问答的全链路自动化处理。

❓ FAQ 摘要

针对用户最关心的引用问题,Haiku RAG 支持在命令行中使用 `--cite` 参数。例如,通过 `haiku-rag ask "问题" --cite`,系统不仅会回答问题,还会自动标注答案的出处,帮助用户验证信息的准确性。

🎯 aiskill88 AI 点评 A 级 2026-05-21

成熟的RAG框架,整合业界优质组件,文档完整社区活跃。适合企业级应用构建,代码质量稳定。

📚 实用指南(长尾问题)
适合谁
  • 需要让 Claude / Cursor 操作本地工具的 AI 工程师
  • 构建多智能体协作系统的 Agent 开发者
  • 构建企业知识库 / RAG 检索应用的团队
最佳实践
  • 配置 MCP 服务器时建议使用 stdio 传输 + JSON-RPC,避免暴露公网
  • 生产部署优先使用 Docker Compose 隔离依赖,并挂载 volume 持久化数据
  • 本地部署优先选 GGUF 量化模型,节省显存并保持响应速度
  • 分块大小建议 256-512 tokens,向量库优选 pgvector 或 Qdrant
  • Agent 任务先做 dry-run 验证工具调用链,再开启自主执行
常见错误
  • API key 直接提交到 git 仓库(请用 .env 并加入 .gitignore)
  • MCP 配置路径拼错或权限不足,重启 Claude Desktop 才生效
  • 容器内无法访问宿主机 localhost — 使用 host.docker.internal
  • embedding 模型与查询模型不一致导致检索失效
  • 显存不足直接 OOM — 优先降低 context 或换更小的量化模型
  • Python 依赖冲突:建议用 venv / uv 隔离环境
部署方案
  • Docker:haiku-rag 提供官方镜像,docker compose up 一键启动
  • CLI:直接 npm install -g / pip install,命令行调用
  • 本地部署:CPU 8GB 起,GPU 推荐 16GB+ 显存
  • 云端托管:可放在 Vercel / Railway / Fly.io 等 PaaS 平台
相关搜索
haiku-rag 中文教程haiku-rag 安装报错怎么办haiku-rag MCP 配置haiku-rag Docker 部署haiku-rag Agent 工作流haiku-rag 与同类工具对比haiku-rag 最佳实践haiku-rag 适合谁用

⚡ 核心功能

👥 适合谁
  • 需要让 Claude / Cursor 操作本地工具的 AI 工程师
  • 构建多智能体协作系统的 Agent 开发者
  • 构建企业知识库 / RAG 检索应用的团队
⭐ 最佳实践
  • 配置 MCP 服务器时建议使用 stdio 传输 + JSON-RPC,避免暴露公网
  • 生产部署优先使用 Docker Compose 隔离依赖,并挂载 volume 持久化数据
  • 本地部署优先选 GGUF 量化模型,节省显存并保持响应速度
  • 分块大小建议 256-512 tokens,向量库优选 pgvector 或 Qdrant
⚠️ 常见错误
  • API key 直接提交到 git 仓库(请用 .env 并加入 .gitignore)
  • MCP 配置路径拼错或权限不足,重启 Claude Desktop 才生效
  • 容器内无法访问宿主机 localhost — 使用 host.docker.internal
  • embedding 模型与查询模型不一致导致检索失效

👥 适合人群

Claude Desktop / Claude Code 用户AI 工具开发者需要扩展 AI 能力的专业人士自动化工程师

🎯 使用场景

  • 在 Claude Desktop 对话中直接调用本地工具,实现 AI 与系统的深度联动
  • 通过自然语言驱动复杂的多步骤自动化任务,代替繁琐手动操作
  • 将多个 MCP 工具组合使用,构建个人专属 AI 工作站

⚖️ 优点与不足

✅ 优点
  • +MIT 协议,可免费商用
  • +标准化 MCP 协议,生态互联性强
  • +与 Claude 官方生态无缝对接
  • +即插即用,配置简单快捷
⚠️ 不足
  • 依赖 Claude 客户端,非 Claude 用户无法使用
  • MCP 协议仍在持续演进,接口可能变更
  • 需要一定的配置步骤
⚠️ 使用须知

AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。

建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。

📄 License 说明

✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。

🔗 相关工具推荐

📰 相关 AI 新闻
🍿 AI 圈相关吃瓜
🗺️ 相关解决方案
🧩 你可能还需要
基于当前 Skill 的能力图谱,自动补全的工具组合

❓ 常见问题 FAQ

haiku-rag 是一款Python开发的AI辅助工具。开源MCP工具:Opinionated agentic RAG powered by LanceDB, Pydantic AI, and Docling。⭐527 · Python 主要应用场景包括:企业知识库构建、智能问答系统、文档智能检索。
💡 AI Skill Hub 点评

AI Skill Hub 点评:Haiku RAG智能检索系统 的核心功能完整,质量优秀。对于Claude Desktop / Claude Code 用户来说,这是一个值得纳入个人工具库的选择。建议先在非生产环境试用,再逐步推广。

⬇️ 获取与下载
⬇ 下载源码 ZIP

✅ MIT 协议 · 可免费商用 · 直接从 aiskill88 服务器下载,无需跳转 GitHub

📚 深入学习 Haiku RAG智能检索系统
查看分步骤安装教程和完整使用指南,快速上手这款工具
🌐 原始信息
原始名称 haiku-rag
原始描述 开源MCP工具:Opinionated agentic RAG powered by LanceDB, Pydantic AI, and Docling。⭐527 · Python
Topics RAG向量数据库文档解析智能体MCP服务
GitHub https://github.com/ggozad/haiku.rag
License MIT
语言 Python
🔗 原始来源
🐙 GitHub 仓库  https://github.com/ggozad/haiku.rag

收录时间:2026-05-20 · 更新时间:2026-05-30 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。

📺 订阅 AI Skill Hub Daily Telegram 频道
每天 8 条精选 AI Skill、MCP、Agent 与自动化工具推送
加入频道 →