经 AI Skill Hub 精选评估,Haiku RAG智能检索系统 获评「强烈推荐」。这款MCP工具在功能完整性、社区活跃度和易用性方面表现出色,AI 评分 8.2 分,适合有一定技术背景的用户使用。
基于LanceDB、Pydantic AI和Docling的开源MCP工具,提供意见性的智能体RAG能力。支持文档解析、向量检索和多模态数据处理,适合需要构建智能知识库和问答系统的开发者。
Haiku RAG智能检索系统 是一款遵循 MCP(Model Context Protocol)标准协议的 AI 工具扩展。通过 MCP 协议,它可以让 Claude、Cursor 等主流 AI 客户端直接访问和操作外部工具、数据源和服务,实现 AI 能力的无缝扩展。无论是文件操作、数据库查询还是 API 调用,都可以通过自然语言在 AI 对话中直接触发,极大提升生产效率。
基于LanceDB、Pydantic AI和Docling的开源MCP工具,提供意见性的智能体RAG能力。支持文档解析、向量检索和多模态数据处理,适合需要构建智能知识库和问答系统的开发者。
Haiku RAG智能检索系统 是一款遵循 MCP(Model Context Protocol)标准协议的 AI 工具扩展。通过 MCP 协议,它可以让 Claude、Cursor 等主流 AI 客户端直接访问和操作外部工具、数据源和服务,实现 AI 能力的无缝扩展。无论是文件操作、数据库查询还是 API 调用,都可以通过自然语言在 AI 对话中直接触发,极大提升生产效率。
# 方式一:通过 Claude Code CLI 一键安装
claude skill install https://github.com/ggozad/haiku.rag
# 方式二:手动配置 claude_desktop_config.json
{
"mcpServers": {
"haiku-rag------": {
"command": "npx",
"args": ["-y", "haiku.rag"]
}
}
}
# 配置文件位置
# macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
# Windows: %APPDATA%/Claude/claude_desktop_config.json
# 安装后在 Claude 对话中直接使用 # 示例: 用户: 请帮我用 Haiku RAG智能检索系统 执行以下任务... Claude: [自动调用 Haiku RAG智能检索系统 MCP 工具处理请求] # 查看可用工具列表 # 在 Claude 中输入:"列出所有可用的 MCP 工具"
// claude_desktop_config.json 配置示例
{
"mcpServers": {
"haiku_rag______": {
"command": "npx",
"args": ["-y", "haiku.rag"],
"env": {
// "API_KEY": "your-api-key-here"
}
}
}
}
// 保存后重启 Claude Desktop 生效
Agentic RAG built on LanceDB, Pydantic AI, and Docling.
New: vision and multimodal search. Picture-aware ingestion captures embedded figure bytes; vision-capable QA models receive them alongside text. Multimodal embedders put picture vectors in the same space as text, enabling text-as-query → figure hits and image-as-query retrieval.
multimodal: true on vLLM/VoyageAI/Cohere). QA: any model supported by Pydantic AIhaiku-ingester service with persistent SQLite queue, async worker pool with retries and a dead-letter queue, FS / HTTP / S3 / WebDAV source adapters, FastAPI control plane, and a browser dashboard for operators. See docs/ingester.md.--beforepip install haiku.rag-slim
Install only the extras you need. See the Installation documentation for available options.
Python 3.12 or newer required
Note: Requires an embedding provider (Ollama, OpenAI, etc.). See the Tutorial for setup instructions.
```bash
See the examples directory for working examples:
haiku-ingester) and MCP serverhaiku-ingester serve ```
See Configuration for customization options.
from haiku.rag.client import HaikuRAG
async with HaikuRAG("knowledge.lancedb", create=True) as rag:
# Index documents
await rag.create_document_from_source("paper.pdf")
await rag.create_document_from_source("https://arxiv.org/pdf/1706.03762")
# Search — returns chunks with provenance
results = await rag.search("self-attention")
for result in results:
print(f"{result.score:.2f} | p.{result.page_numbers} | {result.content[:100]}")
# QA with citations
answer, citations = await rag.ask("What is the complexity of self-attention?")
print(answer)
for cite in citations:
print(f" [{cite.chunk_id}] p.{cite.page_numbers}: {cite.content[:80]}")
For details on the skills the client wraps, see the Skills docs.
pip install haiku.rag
Includes all features: document processing, all embedding providers, and rerankers.
Using uv? uv pip install haiku.rag
haiku-rag ask "What datasets were used for evaluation?"
Haiku RAG 是一个基于 LanceDB、Pydantic AI 和 Docling 构建的 Agentic RAG 系统。它旨在为开发者提供强大的检索增强生成能力,通过结合先进的向量数据库与智能 Agent 框架,实现高度自动化且具备推理能力的文档检索与问答流程。
本项目具备强大的检索与问答能力:支持结合向量与全文检索的 Hybrid search(通过 Reciprocal Rank Fusion 算法优化结果);支持 Multimodal 与 cross-modal 检索,利用 vLLM 实现图文向量对齐,支持以文搜图或以图搜文;问答系统支持带引用的 Question answering,可精准定位页码与章节;同时具备 Vision QA 能力,允许视觉模型直接处理图像字节。
使用本项目需要 Python 3.12 或更高版本。为了保持环境轻量化,我们提供了 Slim Package(通过 `pip install haiku.rag-slim` 安装),允许开发者根据实际需求仅安装必要的依赖项,避免冗余组件占用资源。
安装方式灵活多样。对于追求完整功能的开发者,推荐使用 `pip install haiku.rag` 或通过 `uv pip install haiku.rag` 进行安装。此外,项目也支持通过 Docker 进行快速部署,特别是在需要集成文件监控与 MCP server 的复杂场景下,Docker 是理想的选择。
快速上手指南:在使用前,请务必配置好 Embedding provider(如 Ollama 或 OpenAI 等)。您可以参考官方 Tutorial 进行环境初始化。项目提供了丰富的 Examples 目录,包含基于 Docker 的完整部署方案,以及集成 CopilotKit 前端的 Full-stack Web Application 示例,方便开发者快速构建对话式 RAG 应用。
Haiku RAG 提供了简洁的 Python API。开发者可以通过 `HaikuRAG` 异步上下文管理器轻松管理本地 LanceDB 索引。支持从本地文件或 URL 自动创建文档索引(create_document_from_source),并在搜索时返回带有来源证明(provenance)的文本块,确保检索结果的可追溯性。
推荐安装 Full Package(`pip install haiku.rag`),该版本包含了完整的工作流模块:从文档处理(Document processing)到各类 Embedding providers 以及 Rerankers 重排序器,能够实现从原始文档摄取到最终智能问答的全链路自动化处理。
针对用户最关心的引用问题,Haiku RAG 支持在命令行中使用 `--cite` 参数。例如,通过 `haiku-rag ask "问题" --cite`,系统不仅会回答问题,还会自动标注答案的出处,帮助用户验证信息的准确性。
成熟的RAG框架,整合业界优质组件,文档完整社区活跃。适合企业级应用构建,代码质量稳定。
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。
AI Skill Hub 点评:Haiku RAG智能检索系统 的核心功能完整,质量优秀。对于Claude Desktop / Claude Code 用户来说,这是一个值得纳入个人工具库的选择。建议先在非生产环境试用,再逐步推广。
| 原始名称 | haiku-rag |
| 原始描述 | 开源MCP工具:Opinionated agentic RAG powered by LanceDB, Pydantic AI, and Docling。⭐527 · Python |
| Topics | RAG向量数据库文档解析智能体MCP服务 |
| GitHub | https://github.com/ggozad/haiku.rag |
| License | MIT |
| 语言 | Python |
收录时间:2026-05-20 · 更新时间:2026-05-30 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。
选择 Agent 类型,复制安装指令后粘贴到对应客户端