🔌
MCP工具

PDF阅读MCP服务器

基于 TypeScript · 让 AI 助手直接操作你的系统与工具
英文名:pdf-reader-mcp
⭐ 723 Stars 🍴 66 Forks 💻 TypeScript 📄 MIT 🏷 AI 8.2分
8.2AI 综合评分
PDF处理MCP工具并行处理文档智能LLM集成
✦ AI Skill Hub 推荐

AI Skill Hub 强烈推荐:PDF阅读MCP服务器 是一款优质的MCP工具。AI 综合评分 8.2 分,在同类工具中表现稳健。如果你正在寻找可靠的MCP工具解决方案,这是一个值得深入了解的选择。

📚 深度解析
PDF阅读MCP服务器 是一款基于 MCP(Model Context Protocol)标准协议的 AI 工具扩展。MCP 协议由 Anthropic 开发并开源,旨在建立 AI 模型与外部工具之间的标准化通信接口,目前已被 Claude Desktop、Claude Code、Cursor 等主流 AI 工具采纳。

通过安装 PDF阅读MCP服务器,你的 AI 助手将获得额外的工具调用能力,可以用自然语言直接操控该工具的功能,无需学习复杂的命令行语法。MCP 工具的核心价值在于"一次配置,永久增强"——配置完成后,每次与 AI 对话时都可以无缝调用这些工具。

在技术实现上,MCP 工具通过标准的 JSON-RPC 协议与 AI 客户端通信,工具的功能以"工具列表"的形式暴露给 AI 模型,AI 可以按需调用。PDF阅读MCP服务器 提供了结构化的工具调用接口,使 AI 模型能够精确地理解和使用每个功能点,显著降低 AI 在工具使用上的错误率。

与传统的 API 集成相比,MCP 工具的优势在于无需编写代码——用户只需在配置文件中添加几行 JSON,即可让 AI 获得全新能力。AI Skill Hub 将 PDF阅读MCP服务器 评为 AI 评分 8.2 分,属于同类工具中的优质选择。
📋 工具概览

生产级MCP服务器,专门用于PDF文档处理。采用并行处理技术,性能比传统方案快5-10倍。适合AI智能体、LLM应用和自动化文档处理系统集成,帮助开发者快速构建文档智能化解决方案。

PDF阅读MCP服务器 是一款遵循 MCP(Model Context Protocol)标准协议的 AI 工具扩展。通过 MCP 协议,它可以让 Claude、Cursor 等主流 AI 客户端直接访问和操作外部工具、数据源和服务,实现 AI 能力的无缝扩展。无论是文件操作、数据库查询还是 API 调用,都可以通过自然语言在 AI 对话中直接触发,极大提升生产效率。

GitHub Stars
⭐ 723
开发语言
TypeScript
支持平台
Windows / macOS / Linux
维护状态
正常维护,社区驱动
开源协议
MIT
AI 综合评分
8.2 分
工具类型
MCP工具
Forks
66
📖 中文文档
以下内容由 AI Skill Hub 根据项目信息自动整理,如需查看完整原始文档请访问底部「原始来源」。

生产级MCP服务器,专门用于PDF文档处理。采用并行处理技术,性能比传统方案快5-10倍。适合AI智能体、LLM应用和自动化文档处理系统集成,帮助开发者快速构建文档智能化解决方案。

PDF阅读MCP服务器 是一款遵循 MCP(Model Context Protocol)标准协议的 AI 工具扩展。通过 MCP 协议,它可以让 Claude、Cursor 等主流 AI 客户端直接访问和操作外部工具、数据源和服务,实现 AI 能力的无缝扩展。无论是文件操作、数据库查询还是 API 调用,都可以通过自然语言在 AI 对话中直接触发,极大提升生产效率。

📌 核心特色
  • 通过标准 MCP 协议与 Claude、Cursor 等主流 AI 客户端深度集成
  • 提供结构化工具调用接口,显著降低 AI 集成复杂度
  • 支持 Claude Desktop 和 Claude Code 无缝接入,开箱即用
  • 可与其他 MCP 工具组合叠加,构建完整 AI 工作站
  • 轻量无侵入设计,不影响现有系统架构
🎯 主要使用场景
  • 在 Claude Desktop 对话中直接调用本地工具,实现 AI 与系统的深度联动
  • 通过自然语言驱动复杂的多步骤自动化任务,代替繁琐手动操作
  • 将多个 MCP 工具组合使用,构建个人专属 AI 工作站
以下安装命令基于项目开发语言和类型自动生成,实际以官方 README 为准。
安装命令
# 方式一:通过 Claude Code CLI 一键安装
claude skill install https://github.com/SylphxAI/pdf-reader-mcp

# 方式二:手动配置 claude_desktop_config.json
{
  "mcpServers": {
    "pdf--mcp---": {
      "command": "npx",
      "args": ["-y", "pdf-reader-mcp"]
    }
  }
}

# 配置文件位置
# macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
# Windows: %APPDATA%/Claude/claude_desktop_config.json
📋 安装步骤说明
  1. 确认已安装 Node.js(v18 或以上版本)
  2. 打开 Claude Desktop 或 Claude Code 的 MCP 配置文件
  3. 按「交给 Agent 安装 → Claude Desktop」标签中的 JSON 配置填入 mcpServers 字段
  4. 保存配置文件并重启 Claude 客户端
  5. 重启后,在对话中即可使用本工具
以下用法示例由 AI Skill Hub 整理,涵盖最常见的使用场景。
常用命令 / 代码示例
# 安装后在 Claude 对话中直接使用
# 示例:
用户: 请帮我用 PDF阅读MCP服务器 执行以下任务...
Claude: [自动调用 PDF阅读MCP服务器 MCP 工具处理请求]

# 查看可用工具列表
# 在 Claude 中输入:"列出所有可用的 MCP 工具"
以下配置示例基于典型使用场景生成,具体参数请参照官方文档调整。
配置示例
// claude_desktop_config.json 配置示例
{
  "mcpServers": {
    "pdf__mcp___": {
      "command": "npx",
      "args": ["-y", "pdf-reader-mcp"],
      "env": {
        // "API_KEY": "your-api-key-here"
      }
    }
  }
}

// 保存后重启 Claude Desktop 生效
📑 README 深度解析 真实文档 完整度 81/100 查看 GitHub 原文 →
以下内容由系统直接从 GitHub README 解析整理,保留代码块、表格与列表结构。

简介

🚀 Overview

PDF Reader MCP is a production-ready Model Context Protocol server that empowers AI agents with enterprise-grade PDF processing capabilities. Extract text, images, and metadata with unmatched performance and reliability.

The Problem:

// Traditional PDF processing
- Sequential page processing (slow)
- No natural content ordering
- Complex path handling
- Poor error isolation

The Solution:

// PDF Reader MCP
- 5-10x faster parallel processing ⚡
- Y-coordinate based ordering 📐
- Flexible path support (absolute/relative) 🎯
- Per-page error resilience 🛡️
- 94%+ test coverage ✅

Result: Production-ready PDF processing that scales.

---

⚡ Key Features

✨ Features

Core Capabilities

  • Text Extraction - Full document or specific pages with intelligent parsing
  • Image Extraction - Base64-encoded with complete metadata (width, height, format)
  • Content Ordering - Y-coordinate based layout preservation for natural reading flow
  • Metadata Extraction - Author, title, creation date, and custom properties
  • Page Counting - Fast enumeration without loading full content
  • Dual Sources - Local files (absolute or relative paths) and HTTP/HTTPS URLs
  • Batch Processing - Multiple PDFs processed concurrently

Advanced Features

  • 5-10x Performance - Parallel page processing with Promise.all
  • 🎯 Smart Pagination - Extract ranges like "1-5,10-15,20"
  • 🖼️ Multi-Format Images - RGB, RGBA, Grayscale with automatic detection
  • 🛡️ Path Flexibility - Windows, Unix, and relative paths all supported (v1.3.0)
  • 🔍 Error Resilience - Per-page error isolation with detailed messages
  • 📏 Large File Support - Efficient streaming and memory management
  • 📝 Type Safe - Full TypeScript with strict mode enabled

---

🆕 What's New in v1.3.0

📦 Installation

Manual Installation

```bash

Quick start - zero installation

npx @sylphx/pdf-reader-mcp

Or install globally

npm install -g @sylphx/pdf-reader-mcp ```

---

Docker Deployment

FROM oven/bun:1
WORKDIR /app
RUN bun add @sylphx/pdf-reader-mcp
ENV MCP_TRANSPORT=http
ENV MCP_HTTP_PORT=8080
EXPOSE 8080
CMD ["bun", "node_modules/@sylphx/pdf-reader-mcp/dist/index.js"]

🎯 Quick Start

Basic Usage

{
  "sources": [{
    "path": "documents/report.pdf"
  }],
  "include_full_text": true,
  "include_metadata": true,
  "include_page_count": true
}

Result: - ✅ Full text content extracted - ✅ PDF metadata (author, title, dates) - ✅ Total page count - ✅ Structural sharing - unchanged parts preserved

🔧 Advanced Usage

<details> <summary><strong>📐 Y-Coordinate Content Ordering</strong></summary>

<br/>

Content is returned in natural reading order based on Y-coordinates:

Document Layout:
┌─────────────────────┐
│ [Title]       Y:100 │
│ [Image]       Y:150 │
│ [Text]        Y:400 │
│ [Photo A]     Y:500 │
│ [Photo B]     Y:550 │
└─────────────────────┘

Response Order:
[
  { type: "text", text: "Title..." },
  { type: "image", data: "..." },
  { type: "text", text: "..." },
  { type: "image", data: "..." },
  { type: "image", data: "..." }
]

Benefits: - AI understands spatial relationships - Natural document comprehension - Perfect for vision-enabled models - Automatic multi-line text grouping

</details>

<details> <summary><strong>🖼️ Image Extraction</strong></summary>

<br/>

Enable extraction:

{
  "sources": [{ "path": "manual.pdf" }],
  "include_images": true
}

Response format:

{
  "images": [{
    "page": 1,
    "index": 0,
    "width": 1920,
    "height": 1080,
    "format": "rgb",
    "data": "base64-encoded-png..."
  }]
}

Supported formats: RGB, RGBA, Grayscale Auto-detected: JPEG, PNG, and other embedded formats

</details>

<details> <summary><strong>📂 Path Configuration</strong></summary>

<br/>

Absolute paths (v1.3.0+) - Direct file access:

{ "path": "C:\\Users\\John\\file.pdf" }
{ "path": "/home/user/file.pdf" }

Relative paths - Workspace files:

{ "path": "docs/report.pdf" }
{ "path": "./2024/Q1.pdf" }

Configure working directory:

{
  "mcpServers": {
    "pdf-reader-mcp": {
      "command": "npx",
      "args": ["@sylphx/pdf-reader-mcp"],
      "cwd": "/path/to/documents"
    }
  }
}

</details>

<details> <summary><strong>📊 Large PDF Strategies</strong></summary>

<br/>

Strategy 1: Page ranges

{ "sources": [{ "path": "big.pdf", "pages": "1-20" }] }

Strategy 2: Progressive loading

// Step 1: Get page count
{ "sources": [{ "path": "big.pdf" }], "include_full_text": false }

// Step 2: Extract sections
{ "sources": [{ "path": "big.pdf", "pages": "50-75" }] }

Strategy 3: Parallel batching

{
  "sources": [
    { "path": "big.pdf", "pages": "1-50" },
    { "path": "big.pdf", "pages": "51-100" }
  ]
}

</details>

---

Quick Start

```bash

Environment

MCP_PDF_ALLOWED_DIRS="/srv/pdfs:/data/reports" npx @sylphx/pdf-reader-mcp

json { "mcpServers": { "pdf-reader": { "command": "npx", "args": ["@sylphx/pdf-reader-mcp", "--allow-dir=/srv/pdfs"] } } } ```

Environment Variables

VariableDefaultDescription
MCP_TRANSPORTstdioTransport type: stdio or http
MCP_HTTP_PORT8080HTTP server port
MCP_HTTP_HOST0.0.0.0HTTP server hostname
MCP_API_KEY-Optional API key for authentication

MCP Client Configuration (HTTP)

{
  "servers": {
    "pdf-reader": {
      "type": "http",
      "url": "https://your-server.com/mcp",
      "headers": {
        "X-API-Key": "your-api-key"
      }
    }
  }
}

📖 API Reference

CLI flags

npx @sylphx/pdf-reader-mcp --allow-dir=/srv/pdfs --allow-dir=/data/reports

Endpoints

EndpointMethodDescription
/mcpPOSTJSON-RPC endpoint
/mcp/healthGETHealth check

---

VS Code

code --add-mcp '{"name":"pdf-reader","command":"npx","args":["@sylphx/pdf-reader-mcp"]}'

🔧 Troubleshooting

🎯 aiskill88 AI 点评 A 级 2026-05-22

aiskill88点评:成熟的MCP PDF处理方案,性能优势明显,生产就绪。TypeScript实现,集成度高,适合现代AI应用栈。

📚 实用指南(长尾问题)
适合谁
  • 需要让 Claude / Cursor 操作本地工具的 AI 工程师
  • 构建多智能体协作系统的 Agent 开发者
  • 需要从图片、PDF 提取文字的文档自动化场景
最佳实践
  • 配置 MCP 服务器时建议使用 stdio 传输 + JSON-RPC,避免暴露公网
  • 生产部署优先使用 Docker Compose 隔离依赖,并挂载 volume 持久化数据
  • Agent 任务先做 dry-run 验证工具调用链,再开启自主执行
常见错误
  • API key 直接提交到 git 仓库(请用 .env 并加入 .gitignore)
  • MCP 配置路径拼错或权限不足,重启 Claude Desktop 才生效
  • 容器内无法访问宿主机 localhost — 使用 host.docker.internal
部署方案
  • Docker:pdf-reader-mcp 提供官方镜像,docker compose up 一键启动
  • CLI:直接 npm install -g / pip install,命令行调用
  • 云端托管:可放在 Vercel / Railway / Fly.io 等 PaaS 平台
相关搜索
pdf-reader-mcp 中文教程pdf-reader-mcp 安装报错怎么办pdf-reader-mcp MCP 配置pdf-reader-mcp Docker 部署pdf-reader-mcp Agent 工作流pdf-reader-mcp 与同类工具对比pdf-reader-mcp 最佳实践pdf-reader-mcp 适合谁用
⚡ 核心功能
👥 适合人群
Claude Desktop / Claude Code 用户AI 工具开发者需要扩展 AI 能力的专业人士自动化工程师
🎯 使用场景
  • 在 Claude Desktop 对话中直接调用本地工具,实现 AI 与系统的深度联动
  • 通过自然语言驱动复杂的多步骤自动化任务,代替繁琐手动操作
  • 将多个 MCP 工具组合使用,构建个人专属 AI 工作站
⚖️ 优点与不足
✅ 优点
  • +MIT 协议,可免费商用
  • +标准化 MCP 协议,生态互联性强
  • +与 Claude 官方生态无缝对接
  • +即插即用,配置简单快捷
⚠️ 不足
  • 依赖 Claude 客户端,非 Claude 用户无法使用
  • MCP 协议仍在持续演进,接口可能变更
  • 需要一定的配置步骤
⚠️ 使用须知

AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。

建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。

📄 License 说明

✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。

🔗 相关工具推荐
📚 相关教程推荐
❓ 常见问题 FAQ
pdf-reader-mcp 是一款TypeScript开发的AI辅助工具。开源MCP工具:📄 Production-ready MCP server for PDF processing - 5-10x faster with parallel p。⭐723 · TypeScript 主要应用场景包括:AI智能体文档理解、自动化文档提取、批量PDF处理。
💡 AI Skill Hub 点评

总体来看,PDF阅读MCP服务器 是一款质量优秀的MCP工具,在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态,建议收藏备用,结合自身场景选择合适时机引入使用。

⬇️ 获取与下载
⬇ 下载源码 ZIP

✅ MIT 协议 · 可免费商用 · 直接从 aiskill88 服务器下载,无需跳转 GitHub

📚 深入学习 PDF阅读MCP服务器
查看分步骤安装教程和完整使用指南,快速上手这款工具
🌐 原始信息
原始名称 pdf-reader-mcp
原始描述 开源MCP工具:📄 Production-ready MCP server for PDF processing - 5-10x faster with parallel p。⭐723 · TypeScript
Topics PDF处理MCP工具并行处理文档智能LLM集成
GitHub https://github.com/SylphxAI/pdf-reader-mcp
License MIT
语言 TypeScript
🔗 原始来源
🐙 GitHub 仓库  https://github.com/SylphxAI/pdf-reader-mcp 🌐 官方网站  https://sylphx.com

收录时间:2026-05-22 · 更新时间:2026-05-22 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。