AI Skill Hub 强烈推荐:PDF-Assistant-RAG AI技能包 是一款优质的AI工具。AI 综合评分 8.0 分,在同类工具中表现稳健。如果你正在寻找可靠的AI工具解决方案,这是一个值得深入了解的选择。
PDF-Assistant-RAG AI技能包 是一款基于 TypeScript 开发的开源工具,专注于 pdf、typescript、fastapi 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
PDF-Assistant-RAG AI技能包 是一款基于 TypeScript 开发的开源工具,专注于 pdf、typescript、fastapi 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
# 方式一:npm 全局安装 npm install -g pdf-assistant-rag # 方式二:npx 直接运行(无需安装) npx pdf-assistant-rag --help # 方式三:项目依赖安装 npm install pdf-assistant-rag # 方式四:从源码运行 git clone https://github.com/param20h/PDF-Assistant-RAG cd PDF-Assistant-RAG npm install npm start
# 命令行使用
pdf-assistant-rag --help
# 基本用法
pdf-assistant-rag [options] <input>
# Node.js 代码中使用
const pdf_assistant_rag = require('pdf-assistant-rag');
const result = await pdf_assistant_rag.run(options);
console.log(result);
# pdf-assistant-rag 配置说明 # 查看配置选项 pdf-assistant-rag --config-example > config.yml # 常见配置项 # output_dir: ./output # log_level: info # workers: 4 # 环境变量(覆盖配置文件) export PDF_ASSISTANT_RAG_CONFIG="/path/to/config.yml"
--- title: Document AI Analyst emoji: 🧠 colorFrom: indigo colorTo: purple sdk: docker app_port: 7860 pinned: true license: mit
<br/>
██████╗ ██████╗ ███████╗ █████╗ ███████╗███████╗██╗███████╗████████╗ █████╗ ███╗ ██╗████████╗
██╔══██╗██╔══██╗██╔════╝ ██╔══██╗██╔════╝██╔════╝██║██╔════╝╚══██╔══╝██╔══██╗████╗ ██║╚══██╔══╝
██████╔╝██║ ██║█████╗ ███████║███████╗███████╗██║███████╗ ██║ ███████║██╔██╗ ██║ ██║
██╔═══╝ ██║ ██║██╔══╝ ██╔══██║╚════██║╚════██║██║╚════██║ ██║ ██╔══██║██║╚██╗██║ ██║
██║ ██████╔╝██║ ██║ ██║███████║███████║██║███████║ ██║ ██║ ██║██║ ╚████║ ██║
╚═╝ ╚═════╝ ╚═╝ ╚═╝ ╚═╝╚══════╝╚══════╝╚═╝╚══════╝ ╚═╝ ╚═╝ ╚═╝╚═╝ ╚═══╝ ╚═╝
██████╗ █████╗ ██████╗
██╔══██╗██╔══██╗██╔════╝
██████╔╝███████║██║ ███╗
██╔══██╗██╔══██║██║ ██║
██║ ██║██║ ██║╚██████╔╝
╚═╝ ╚═╝╚═╝ ╚═╝ ╚═════╝
PDF-Assistant-RAG is a complete, production-ready AI document assistant that lets users upload complex PDFs, financial reports, legal contracts, and research papers — then chat with an AI that provides accurate, cited answers powered by a multi-stage Retrieval-Augmented Generation pipeline.
The system uses semantic search + cross-encoder reranking to find the most relevant document chunks, streams AI-generated answers token-by-token, and highlights exact source citations with page numbers — all inside a sleek Next.js UI with JWT-secured per-user data isolation.
<br/>
Prerequisites
--- 🚀 Getting Started4. Run with Docker```bash docker compose up --build Docker
<br/> 🌐 DeploymentThis project is deployed on HuggingFace Spaces using Docker. 2. Configure Environment
Edit
Get your free HuggingFace token at huggingface.co/settings/tokens 📦 Environment Variables
<br/> → API running at http://localhost:8000📡 API Reference
Full interactive docs available at
<br/> AI / ML Pipeline
🤖 RAG Pipeline
</td> <td width="33%" valign="top"> 🧠 RAG Pipeline
<br/>
🇨🇳 中文文档镜像
AI 翻译
2026-07-02
英文原文章节由系统翻译为中文摘要,便于快速理解。完整原文见上方 "📑 README 深度解析"。
📌 简介
PDF-Assistant-RAG 是一个面向企业级应用的 Agentic RAG 文档助手。它能够处理复杂的 PDF、财务报告、法律合同及研究论文,并通过多阶段 Retrieval-Augmented Generation 流水线,为用户提供具备准确引用来源的 AI 对话体验。系统结合了语义搜索与 Cross-encoder 重排序技术,确保检索结果的高度相关性与回答的严谨性。 ⚡ 功能介绍
本项目集成了先进的 RAG 技术栈,支持智能递归文本分块(Recursive Text Chunking),并采用本地 Embedding 技术确保数据隐私。通过两阶段检索机制(语义搜索 + Cross-encoder Rerank)与 Top-K 过滤,系统能够实现高精度的问答,并能根据自定义 System Prompts 生成带有原文引用的专业回答。 📋 环境依赖
在开始部署之前,请确保您的开发环境已安装以下必要组件:Python 3.11+ 用于后端逻辑处理,Node.js 20+ 用于前端界面运行,以及 HuggingFace Token 用于调用 LLM 推理 API。此外,建议使用 Docker 环境以简化复杂的依赖管理。 🛠 安装步骤(Docker/pip/源码)
您可以根据需求选择多种部署方式。推荐使用 Docker 进行快速部署,只需运行 `docker compose up --build` 即可构建并启动全栈服务;若需进行二次开发,也可通过源码方式安装,手动配置 Python 与 Node.js 环境并安装相关依赖。 🚀 使用教程
项目启动后,用户可以通过 Web 界面上传 PDF 文档。系统会自动进行文档解析与向量化处理。用户可以直接在对话框中针对文档内容进行提问,AI 将基于检索到的上下文片段进行回答,并标注出信息来源的引用位置,方便用户核实。 ⚙️ 配置说明(含 MCP / env)
在运行前,必须配置环境变量以确保系统正常工作。请将 `.env.example` 复制为 `backend/.env` 并进行编辑。关键参数包括用于 JWT 签名的 `SECRET_KEY`、数据库连接地址 `DATABASE_URL` 以及用于调用 HuggingFace Inference API 的 `HF_TOKEN`。请务必妥善保管您的 Token 信息。 🔌 API 说明
本项目提供了一套完整的 RESTful API 接口,支持用户注册 (`/api/v1/auth/register`)、登录 (`/api/v1/auth/login`) 以及获取当前用户信息 (`/api/v1/auth/me`)。所有受保护的接口均需通过 JWT Token 进行身份验证,确保了企业级应用的安全访问控制。 🔄 工作流/模块
系统的 AI/ML 流水线采用了严谨的设计:首先利用 `all-MiniLM-L6-v2` 模型进行本地化句子嵌入(Embeddings),确保数据不出本地;随后通过语义搜索初步检索,并使用 `ms-marco-MiniLM-L-6-v2` Cross-encoder 进行重排序(Rerank),最后结合 Top-K 过滤与带有引用指令的 System Prompts,实现精准的 RAG 问答流程。
🎯 aiskill88 AI 点评
A 级
2026-05-29
高质量的PDF处理工具,值得推荐 📚 实用指南(长尾问题)
适合谁
最佳实践
常见错误
部署方案
⚡ 核心功能
👥 适合谁
⭐ 最佳实践
⚠️ 常见错误
👥 适合人群🎯 使用场景
⚖️ 优点与不足✅ 优点
⚠️ 不足
⚠️ 使用须知
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。 建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。 📄 License 说明
✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。 🔗 相关工具推荐transformers AI技能包
Hugging Face开源的深度学习框架,提供预训练语言模型、视觉模型和多模态模型。集成BERT、GPT、Llama等
ComfyUI 节点式AI图像生成
强大的开源扩散模型可视化工具,提供图形界面、API和后端服务。采用节点图式设计,支持模块化工作流构建,适合AI绘图、图像
llama-cpp AI技能包
高效的大语言模型C/C++推理框架,支持在本地CPU/GPU上运行量化LLM模型,具有内存占用小、推理速度快的特点。适合
yt-dlp 视频下载
功能强大的开源视频下载工具,支持YouTube、TikTok等数千个视频平台,可自动下载视频、字幕、封面和元数据。适合内
📰 相关 AI 新闻
🍿 AI 圈相关吃瓜
🧩 你可能还需要
基于当前 Skill 的能力图谱,自动补全的工具组合
❓ 常见问题 FAQ参考项目文档和示例代码
💡 AI Skill Hub 点评
总体来看,PDF-Assistant-RAG AI技能包 是一款质量优秀的AI工具,在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态,建议收藏备用,结合自身场景选择合适时机引入使用。 🌐 原始信息
🔗 原始来源
🐙 GitHub 仓库 https://github.com/param20h/PDF-Assistant-RAG
🌐 官方网站 https://param20h-pdf-assit-rag.hf.space
收录时间:2026-05-18 · 更新时间:2026-05-19 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。 |