能力标签
🔌
MCP工具

自托管AI栈

基于 Shell · 让 AI 助手直接操作你的系统与工具
英文名:self-hosted-ai-stack
⭐ 84 Stars 🍴 16 Forks 💻 Shell 📄 MIT 🏷 AI 8.0分
8.0AI 综合评分
aidockershell
✦ AI Skill Hub 推荐

经 AI Skill Hub 精选评估,自托管AI栈 获评「强烈推荐」。这款MCP工具在功能完整性、社区活跃度和易用性方面表现出色,AI 评分 8.0 分,适合有一定技术背景的用户使用。

📚 深度解析

自托管AI栈 是一款基于 MCP(Model Context Protocol)标准协议的 AI 工具扩展。MCP 协议由 Anthropic 开发并开源,旨在建立 AI 模型与外部工具之间的标准化通信接口,目前已被 Claude Desktop、Claude Code、Cursor 等主流 AI 工具采纳。

通过安装 自托管AI栈,你的 AI 助手将获得额外的工具调用能力,可以用自然语言直接操控该工具的功能,无需学习复杂的命令行语法。MCP 工具的核心价值在于"一次配置,永久增强"——配置完成后,每次与 AI 对话时都可以无缝调用这些工具。

在技术实现上,MCP 工具通过标准的 JSON-RPC 协议与 AI 客户端通信,工具的功能以"工具列表"的形式暴露给 AI 模型,AI 可以按需调用。自托管AI栈 提供了结构化的工具调用接口,使 AI 模型能够精确地理解和使用每个功能点,显著降低 AI 在工具使用上的错误率。

与传统的 API 集成相比,MCP 工具的优势在于无需编写代码——用户只需在配置文件中添加几行 JSON,即可让 AI 获得全新能力。AI Skill Hub 将 自托管AI栈 评为 AI 评分 8.0 分,属于同类工具中的优质选择。

📋 工具概览

自托管AI栈 是一款遵循 MCP(Model Context Protocol)标准协议的 AI 工具扩展。通过 MCP 协议,它可以让 Claude、Cursor 等主流 AI 客户端直接访问和操作外部工具、数据源和服务,实现 AI 能力的无缝扩展。无论是文件操作、数据库查询还是 API 调用,都可以通过自然语言在 AI 对话中直接触发,极大提升生产效率。

GitHub Stars
⭐ 84
开发语言
Shell
支持平台
macOS / Linux
维护状态
轻量级项目,按需更新
开源协议
MIT
AI 综合评分
8.0 分
工具类型
MCP工具
Forks
16

📖 中文文档

以下内容由 AI Skill Hub 根据项目信息自动整理,如需查看完整原始文档请访问底部「原始来源」。

自托管AI栈 是一款遵循 MCP(Model Context Protocol)标准协议的 AI 工具扩展。通过 MCP 协议,它可以让 Claude、Cursor 等主流 AI 客户端直接访问和操作外部工具、数据源和服务,实现 AI 能力的无缝扩展。无论是文件操作、数据库查询还是 API 调用,都可以通过自然语言在 AI 对话中直接触发,极大提升生产效率。

📌 核心特色
  • 通过标准 MCP 协议与 Claude、Cursor 等主流 AI 客户端深度集成
  • 提供结构化工具调用接口,显著降低 AI 集成复杂度
  • 支持 Claude Desktop 和 Claude Code 无缝接入,开箱即用
  • 可与其他 MCP 工具组合叠加,构建完整 AI 工作站
  • 轻量无侵入设计,不影响现有系统架构
🎯 主要使用场景
  • 在 Claude Desktop 对话中直接调用本地工具,实现 AI 与系统的深度联动
  • 通过自然语言驱动复杂的多步骤自动化任务,代替繁琐手动操作
  • 将多个 MCP 工具组合使用,构建个人专属 AI 工作站
以下安装命令基于项目开发语言和类型自动生成,实际以官方 README 为准。
安装命令
# 方式一:通过 Claude Code CLI 一键安装
claude skill install https://github.com/hwdsl2/self-hosted-ai-stack

# 方式二:手动配置 claude_desktop_config.json
{
  "mcpServers": {
    "---ai-": {
      "command": "npx",
      "args": ["-y", "self-hosted-ai-stack"]
    }
  }
}

# 配置文件位置
# macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
# Windows: %APPDATA%/Claude/claude_desktop_config.json
📋 安装步骤说明
  1. 确认已安装 Node.js(v18 或以上版本)
  2. 打开 Claude Desktop 或 Claude Code 的 MCP 配置文件
  3. 按「交给 Agent 安装 → Claude Desktop」标签中的 JSON 配置填入 mcpServers 字段
  4. 保存配置文件并重启 Claude 客户端
  5. 重启后,在对话中即可使用本工具
以下用法示例由 AI Skill Hub 整理,涵盖最常见的使用场景。
常用命令 / 代码示例
# 安装后在 Claude 对话中直接使用
# 示例:
用户: 请帮我用 自托管AI栈 执行以下任务...
Claude: [自动调用 自托管AI栈 MCP 工具处理请求]

# 查看可用工具列表
# 在 Claude 中输入:"列出所有可用的 MCP 工具"
以下配置示例基于典型使用场景生成,具体参数请参照官方文档调整。
配置示例
// claude_desktop_config.json 配置示例
{
  "mcpServers": {
    "___ai_": {
      "command": "npx",
      "args": ["-y", "self-hosted-ai-stack"],
      "env": {
        // "API_KEY": "your-api-key-here"
      }
    }
  }
}

// 保存后重启 Claude Desktop 生效
📑 README 深度解析 真实文档 完整度 63/100 含工作流图 查看 GitHub 原文 →
以下内容由系统直接从 GitHub README 解析整理,保留代码块、表格与列表结构。

PostgreSQL with pgvector (required by LiteLLM; pgvector enables vector storage for RAG)

docker run -d --name litellm-db --restart always \ --network ai-stack \ -e POSTGRES_USER=litellm \ -e POSTGRES_PASSWORD=litellm \ -e POSTGRES_DB=litellm \ -v litellm-db:/var/lib/postgresql \ pgvector/pgvector:pg18-trixie

Stop and remove all containers (data is preserved in Docker volumes)

docker compose down ```

Running without Docker Compose

If you prefer using docker run commands directly, first create a shared network so services can communicate:

docker network create ai-stack

Then start each service on the shared network:

Note: With manual docker run, wait for each dependency to become ready before starting services that use it (for example, wait for PostgreSQL and any other dependencies, such as Ollama or MCP, before LiteLLM; if using AnythingLLM, wait for LiteLLM before starting it). For production or shared Docker networks, change the default PostgreSQL password before first start and update every matching connection string.

```bash

Internet-facing deployments

By default, all services listen over plain HTTP. For internet-facing deployments, use the included Caddy overlay to add automatic HTTPS. In proxy mode, Caddy is the only public listener on ports 80 and 443; the direct AnythingLLM and LiteLLM ports are rebound to 127.0.0.1.

Prerequisites:

  • Docker Compose 2.24.4+ (required for the proxy overlay's port override)
  • A DNS A/AAAA record for your domain pointing to this server
  • Inbound 80/tcp, 443/tcp, and ideally 443/udp open in your firewall/security group
  • No other service already using ports 80 or 443 on the host

CPU stack:

DOMAIN=chat.example.com ACME_EMAIL=you@example.com \
  docker compose -f docker-compose.yml -f docker-compose.proxy.yml up -d

CUDA stack:

DOMAIN=chat.example.com ACME_EMAIL=you@example.com \
  docker compose -f docker-compose.cuda.yml -f docker-compose.proxy.yml up -d

Open https://chat.example.com (replace with your DOMAIN) to access AnythingLLM. In proxy mode, http://127.0.0.1:3001 and http://127.0.0.1:4000/ui remain available on the host, but the direct 3001 and 4000 ports are not reachable from outside the server.

The standard compose files publish LiteLLM on port 4000. The proxy overlay changes that direct port to localhost-only, and the included Caddyfile routes only AnythingLLM by default. Uncommenting the optional LiteLLM hostname block exposes LiteLLM through Caddy, so keep the LiteLLM master key secret.

Troubleshooting:

```bash docker logs ai-stack-caddy

Stop and remove all containers (data is preserved in Docker volumes)

docker compose down mkdir -p backups for vol in ollama-data litellm-data litellm-db embeddings-data whisper-data whisper-live-data kokoro-data mcp-data docling-data anythingllm-data caddy-data caddy-config; do docker volume inspect "$vol" >/dev/null 2>&1 && \ docker run --rm -v "${vol}:/source:ro" -v "$(pwd)/backups:/backup" \ alpine tar czf "/backup/${vol}.tar.gz" -C /source . done ```

Note: The ollama-shared, mcp-shared, and litellm-shared volumes are ephemeral key-sharing volumes and do not need to be backed up.

For restore instructions, server migration, and the full pre-upgrade checklist, see the Backup and Restore guide.

Quick start

Requirements:

  • A Linux server (local or cloud) with Docker installed
  • At least 8 GB of RAM (with small models). For larger LLM models (8B+), 16 GB or more is recommended.
  • You can comment out services you don't need to reduce memory usage.

Start the full stack:

```bash

Voice pipeline example

Transcribe a spoken question, get a local LLM response via Ollama, and convert it to speech:

Note: Kokoro (TTS) is disabled by default. To use this example, first uncomment the kokoro service in docker-compose.yml, then run docker compose up -d.

Tip: Need a sample audio file? Download this English speech sample (WAV, MIT License) from the Azure Samples repository:

curl -L -o sample_speech.wav \
    "https://github.com/Azure-Samples/cognitive-services-speech-sdk/raw/master/sampledata/audiofiles/katiesteve.wav"

```bash LITELLM_KEY=$(docker exec litellm litellm_manage --getkey)

RAG pipeline example

Embed documents for semantic search, retrieve context, then answer questions with a local Ollama model:

```bash LITELLM_KEY=$(docker exec litellm litellm_manage --getkey)

MCP tools example

Use MCP Gateway to give your AI assistant access to files, web, and GitHub:

```bash MCP_KEY=$(docker exec mcp mcp_manage --showkey | grep '^mcp-' | head -1)

Set Authorization header: Bearer <api_key>

Or test the MCP endpoint directly with an initialize request

curl -s http://localhost:3000/mcp \ -X POST \ -H "Authorization: Bearer $MCP_KEY" \ -H "Content-Type: application/json" \ -H "Accept: application/json, text/event-stream" \ -d '{"jsonrpc":"2.0","id":1,"method":"initialize","params":{"protocolVersion":"2025-03-26","capabilities":{},"clientInfo":{"name":"test","version":"1.0"}}}' ```

Export API keys (while containers are running)

docker exec ollama ollama_manage --showkey docker exec litellm litellm_manage --showkey docker exec mcp mcp_manage --showkey

Use MCP endpoint with an AI client (e.g., Cline in VS Code)

Step 2: At query time, embed the question, retrieve the top matching chunks from

the vector DB, then send the question and retrieved context to Ollama via LiteLLM.

curl -s http://localhost:4000/v1/chat/completions \ -H "Authorization: Bearer $LITELLM_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "ollama/llama3.2:3b", "messages": [ {"role": "system", "content": "Answer using only the provided context."}, {"role": "user", "content": "What does Docker do?\n\nContext: Docker simplifies deployment by packaging apps in containers."} ] }' \ | jq -r '.choices[0].message.content' ```

🎯 aiskill88 AI 点评 A 级 2026-06-15

高质量的AI栈部署工具

⚡ 核心功能

👥 适合人群

Claude Desktop / Claude Code 用户AI 工具开发者需要扩展 AI 能力的专业人士自动化工程师

🎯 使用场景

  • 在 Claude Desktop 对话中直接调用本地工具,实现 AI 与系统的深度联动
  • 通过自然语言驱动复杂的多步骤自动化任务,代替繁琐手动操作
  • 将多个 MCP 工具组合使用,构建个人专属 AI 工作站

⚖️ 优点与不足

✅ 优点
  • +MIT 协议,可免费商用
  • +标准化 MCP 协议,生态互联性强
  • +与 Claude 官方生态无缝对接
  • +即插即用,配置简单快捷
⚠️ 不足
  • 依赖 Claude 客户端,非 Claude 用户无法使用
  • MCP 协议仍在持续演进,接口可能变更
  • 需要一定的配置步骤
⚠️ 使用须知

AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。

建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。

📄 License 说明

✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。

🔗 相关工具推荐

🧩 你可能还需要
基于当前 Skill 的能力图谱,自动补全的工具组合

❓ 常见问题 FAQ

使用Docker Compose命令部署
💡 AI Skill Hub 点评

AI Skill Hub 点评:自托管AI栈 的核心功能完整,质量优秀。对于Claude Desktop / Claude Code 用户来说,这是一个值得纳入个人工具库的选择。建议先在非生产环境试用,再逐步推广。

⬇️ 获取与下载
⬇ 下载源码 ZIP

✅ MIT 协议 · 可免费商用 · 直接从 aiskill88 服务器下载,无需跳转 GitHub

📚 深入学习 自托管AI栈
查看分步骤安装教程和完整使用指南,快速上手这款工具
🌐 原始信息
原始名称 self-hosted-ai-stack
Topics aidockershell
GitHub https://github.com/hwdsl2/self-hosted-ai-stack
License MIT
语言 Shell
🔗 原始来源
🐙 GitHub 仓库  https://github.com/hwdsl2/self-hosted-ai-stack

收录时间:2026-06-15 · 更新时间:2026-06-15 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。

📺 订阅 AI Skill Hub Daily Telegram 频道
每天 8 条精选 AI Skill、MCP、Agent 与自动化工具推送
加入频道 →