📄 工具详情 ⚙️ 安装教程 📚 使用教程

能力标签

🔌 MCP 🤖 Agent 🔄 工作流 💻 CLI 📚 RAG 🧠 Claude ✨ GPT 🖥 本地 LLM ⛓ LangChain

💬

Prompt模板

智能提示评估

Q: oh-my-knowledge 如何安装和开始使用？

访问 oh-my-knowledge 的 GitHub 仓库或官方网站，按照 README 文档中的步骤安装依赖并运行。通常需要 Python 3.8+ 或 Node.js 16+ 基础环境。

Q: oh-my-knowledge 是否免费？许可证是什么？

oh-my-knowledge 完全免费，采用 MIT 许可证开源发布，任何人都可以免费使用、修改和分发。

Q: oh-my-knowledge 适合哪些用户使用？

oh-my-knowledge 主要面向有一定技术基础的用户，包括开发者、数据分析师、AI 工程师等专业人士。

Q: oh-my-knowledge 的社区活跃度和项目维护状况如何？

oh-my-knowledge 在 GitHub 上已获得 6 个 Star，处于积极发展阶段，社区在持续扩大。

基于 TypeScript · 专业级提示词模板，解锁 AI 的真实潜力

英文名：oh-my-knowledge

⭐ 6 Stars 🍴 2 Forks 💻 TypeScript 📄 MIT 🏷 AI 7.5分

7.5AI 综合评分

AILLMbenchmarkprompt

⬇ 下载源码 ZIP ⚙️ 配置说明

✦ AI Skill Hub 推荐

AI Skill Hub 推荐使用：智能提示评估是一款优质的Prompt模板。AI 综合评分 7.5 分，在同类工具中表现稳健。如果你正在寻找可靠的Prompt模板解决方案，这是一个值得深入了解的选择。

📚 深度解析

智能提示评估是经过精心设计和实践验证的专业 Prompt 模板。Prompt 工程（Prompt Engineering）是充分发挥 Claude、ChatGPT 等大型语言模型潜力的关键技能，而一套经过优化的 Prompt 模板可以将 AI 输出质量提升数倍。

优质 Prompt 模板的核心价值在于其结构化设计：明确的角色设定、精确的任务描述、具体的输出格式要求和必要的边界条件，这些要素共同构成了一个能够持续产出高质量结果的 Prompt 框架。智能提示评估提供的模板经过反复迭代和用户验证，能够有效减少 AI 的"幻觉"（Hallucination）和输出不稳定问题。

无论你使用 Claude 3.5 Sonnet、GPT-4、Gemini 还是国内的文心一言、智谱 AI，优质的 Prompt 设计都能跨模型复用。AI Skill Hub 建议将本模板保存为个人 Prompt 库的标准组件，根据具体场景调整参数后反复使用，形成自己的 AI 提效工作流。

📋 工具概览

评估LLM知识输入的框架，提供prompt模板和benchmark

智能提示评估是经过精心设计和反复验证的专业 Prompt 模板集合。这些 Prompt 框架能够有效激活 Claude、ChatGPT 等大型语言模型的深层能力，让 AI 生成更准确、更有价值的输出结果。无需任何安装，直接复制模板内容到 AI 对话框即可使用。

GitHub Stars

⭐ 6

开发语言

TypeScript

支持平台

Windows / macOS / Linux

维护状态

轻量级项目，按需更新

开源协议

MIT

AI 综合评分

7.5 分

工具类型

Prompt模板

Forks

📖 中文文档

以下内容由 AI Skill Hub 根据项目信息自动整理，如需查看完整原始文档请访问底部「原始来源」。

评估LLM知识输入的框架，提供prompt模板和benchmark

📌 核心特色

精心设计的 Prompt 框架，快速激活 AI 的深层能力
支持参数化替换，灵活适配多种业务场景
经过反复验证的指令结构，显著提升 AI 输出质量和一致性
适用于 Claude、ChatGPT 等主流大语言模型
可作为团队标准 Prompt 模板复用和二次开发

🎯 主要使用场景

快速生成高质量的专业文案、分析报告或结构化内容
利用 Prompt 框架引导 AI 解决特定领域的复杂问题
在不同 AI 工具间复用经过验证的提示词模板

以下安装命令基于项目开发语言和类型自动生成，实际以官方 README 为准。

安装命令

# Prompt 无需安装，直接复制使用
# 支持：Claude / ChatGPT / Gemini / 通义千问 等主流模型

# 使用步骤
# 1. 复制 Prompt 模板内容
# 2. 粘贴到 AI 对话框
# 3. 替换 [占位符] 为实际内容
# 4. 发送后获取结构化输出

# 获取原始文件
git clone https://github.com/lizhiyao/oh-my-knowledge

📋 安装步骤说明

复制本工具的 Prompt 模板内容
打开 Claude、ChatGPT 或其他 AI 对话工具
将 Prompt 粘贴到对话框开头
根据实际需求替换 [占位符] 中的内容
发送后 AI 将按照模板格式执行，获得结构化输出

以下用法示例由 AI Skill Hub 整理，涵盖最常见的使用场景。

常用命令 / 代码示例

# 粘贴到 Claude/ChatGPT 使用
# 示例 Prompt 结构：

你是一位 [角色]，擅长 [领域]。
请根据以下要求完成任务：

任务背景：[描述背景]
具体要求：[详细说明]
输出格式：[期望格式]

# 将 [] 内内容替换为实际需求

以下配置示例基于典型使用场景生成，具体参数请参照官方文档调整。

配置示例

# oh-my-knowledge 配置说明
# 查看配置选项
oh-my-knowledge --config-example > config.yml

# 常见配置项
# output_dir: ./output
# log_level: info
# workers: 4

# 环境变量（覆盖配置文件）
export OH_MY_KNOWLEDGE_CONFIG="/path/to/config.yml"

📑 README 深度解析真实文档完整度 55/100 查看 GitHub 原文 →

以下内容由系统直接从 GitHub README 解析整理，保留代码块、表格与列表结构。

oh-my-knowledge

English | 简体中文

Did your prompt actually get better? A/B test your prompts and skills with statistical rigor — bootstrap CI and length-debias on by default, Krippendorff α the moment you add a gold set.

omk report — verdict pill "v2 is clearly better than v1 — ready to ship"

Features

Feature	What it does
One-line verdict	`omk eval` six-tier verdict + ship recommendation + exit-code routing; HTML pill shares the same rules
Six-dim evaluation	Fact / Behavior / LLM-judge / Cost / Efficiency / Stability shown independently
Multi-executor	Claude CLI / Claude SDK / Codex CLI / Codex SDK / OpenAI / Gemini / Anthropic API / any custom command
30+ assertion types	substring, regex, JSON Schema, ROUGE/BLEU/Levenshtein similarity, agent tool-call assertions, semantic similarity, custom JS
Statistical rigor	Bootstrap CI / length-debias / saturation curve on by default; Krippendorff α auto-computed with a gold set. [Details →](docs/explanation/statistical-rigor.md)
RAG metrics	`faithfulness` / `answer_relevancy` / `context_recall` — anti-hallucination + answer relevance + context coverage
LLM health audit	`omk doctor` grades 7 builtin dimensions; `--static-only` runs offline without an LLM
Production observability	parse Claude Code session JSONL traces; measure per-skill failure rate / latency / cost / knowledge-gap signals
Knowledge-gap detection	severity-weighted signals quantify risk exposure instead of claiming completeness
Construct-validity isolation	`--strict-baseline` (default ON) cuts three contamination channels so baseline doesn't silently see the skill it's being compared against
Sample design science	sample schema with `capability` / `difficulty` / `construct` / `provenance` metadata (HF Dataset Cards style); studio surfaces coverage breakdown plus `rubric_clarity_low` / `capability_thin` flags. [docs/specs/sample-design-spec.md](docs/specs/sample-design-spec.md)
Multi-judge ensemble	`--judge-models claude:opus,openai:gpt-4o` cross-vendor scoring + agreement metrics
Blind A/B	`--blind` hides variant names; HTML report has a reveal button
Multi-run variance	`--repeat N` repeats the eval and computes mean / SD / CI / t-test
MCP URL fetching	pull content from private-doc URLs via an MCP server (SSO-protected knowledge bases, etc.)
Auto analysis	detects low-discrimination assertions, flat scores, all-pass / all-fail, expensive samples
Traceability	reports carry CLI version, Node version, artifact version fingerprint, judge prompt hash
EN / ZH switch	one-click language toggle in the HTML report

Requirements

Node.js >= 22
claude CLI (for the default executor and LLM judge; see Claude Code)
not needed if you use other executors (openai-api / anthropic-api / gemini) with --no-judge

Quick start

npm i -g oh-my-knowledge
omk init demo && cd demo
omk eval --control code-review-v1 --treatment code-review-v2

That's it — no editing required. omk init scaffolds two skill variants and three sample cases; omk eval runs the controlled A/B and opens an HTML report with a one-line verdict in about five minutes.

Walkthrough: 5-minute quickstart guide (recommended for first-time users).

Deeper: CLI reference · how it works · eval sample format · executors & artifact layout

Environment variables

Variable	Description
`CCV_PROXY_URL`	proxy requests through cc-viewer for live eval-traffic visualization
`OMK_REPORT_PORT`	report server port (default: 7799)

Why omk over alternatives

	omk	promptfoo	DeepEval	LangSmith
Bootstrap CI	✓ default	✗	✗	✗
Krippendorff α (judge ↔ human)	✓ with gold set	✗	✗	✗
Length-debias judge prompt	✓ default	✗	✗	✗
Saturation curve	✓	✗	✗	✗
Three-layer scoring isolation	✓	✗	partial	✗
Per-variant skill isolation (construct validity)	✓ default	✗	✗	✗
Native Claude Code skill	✓	✗	✗	✗
Hosted SaaS dashboard	✗	✗	✓	✓

omk's moat is default-on safety net — Bootstrap CI and length-debias aren't advanced flags; they're the default, and judge ↔ human α comes free the moment you add a gold set. Other tools let you opt into confidence intervals; omk makes them unavoidable. Need a hosted SaaS dashboard? Choose LangSmith. Want quick local prompt iteration without statistics? Choose promptfoo. Shipping to production and someone will ask "why should I trust this number?" Choose omk.

RAG-specific evals: see RAGAS (separate niche, complementary to omk). Full comparison with 7 tools across 25+ dimensions: docs/reference/comparison.md.

🎯 aiskill88 AI 点评 A 级 2026-06-01

一个评估LLM知识输入的有用框架

📚 实用指南（长尾问题）

适合谁

需要让 Claude / Cursor 操作本地工具的 AI 工程师
构建多智能体协作系统的 Agent 开发者
构建企业知识库 / RAG 检索应用的团队
想快速复用高质量提示词模板的 AI 用户

最佳实践

配置 MCP 服务器时建议使用 stdio 传输 + JSON-RPC，避免暴露公网
本地部署优先选 GGUF 量化模型，节省显存并保持响应速度
分块大小建议 256-512 tokens，向量库优选 pgvector 或 Qdrant
Agent 任务先做 dry-run 验证工具调用链，再开启自主执行

常见错误

API key 直接提交到 git 仓库（请用 .env 并加入 .gitignore）
MCP 配置路径拼错或权限不足，重启 Claude Desktop 才生效
embedding 模型与查询模型不一致导致检索失效
显存不足直接 OOM — 优先降低 context 或换更小的量化模型

部署方案

CLI：直接 npm install -g / pip install，命令行调用
本地部署：CPU 8GB 起，GPU 推荐 16GB+ 显存
云端托管：可放在 Vercel / Railway / Fly.io 等 PaaS 平台

⚡ 核心功能

精心设计的 Prompt 框架，快速激活 AI 的深层能力
支持参数化替换，灵活适配多种业务场景
经过反复验证的指令结构，显著提升 AI 输出质量和一致性
适用于 Claude、ChatGPT 等主流大语言模型
可作为团队标准 Prompt 模板复用和二次开发

👥 适合谁

需要让 Claude / Cursor 操作本地工具的 AI 工程师
构建多智能体协作系统的 Agent 开发者
构建企业知识库 / RAG 检索应用的团队
想快速复用高质量提示词模板的 AI 用户

⭐ 最佳实践

配置 MCP 服务器时建议使用 stdio 传输 + JSON-RPC，避免暴露公网
本地部署优先选 GGUF 量化模型，节省显存并保持响应速度
分块大小建议 256-512 tokens，向量库优选 pgvector 或 Qdrant
Agent 任务先做 dry-run 验证工具调用链，再开启自主执行

⚠️ 常见错误

API key 直接提交到 git 仓库（请用 .env 并加入 .gitignore）
MCP 配置路径拼错或权限不足，重启 Claude Desktop 才生效
embedding 模型与查询模型不一致导致检索失效
显存不足直接 OOM — 优先降低 context 或换更小的量化模型

👥 适合人群

内容创作者和自媒体人职场人士和学生ChatGPT / Claude 重度用户希望提升 AI 使用效率的普通用户

🎯 使用场景

快速生成高质量的专业文案、分析报告或结构化内容
利用 Prompt 框架引导 AI 解决特定领域的复杂问题
在不同 AI 工具间复用经过验证的提示词模板

⚖️ 优点与不足

✅ 优点

+MIT 协议，可免费商用
+无需安装，立即可用
+适配所有主流 AI 工具
+经社区验证的最佳实践

⚠️ 不足

−效果依赖使用者对 Prompt 工程的熟悉程度
−不同模型和版本的响应效果可能存在差异
−复杂场景需结合实际需求二次调整

⚠️ 使用须知

AI Skill Hub 为第三方内容聚合平台，本页面信息基于公开数据整理，不对工具功能和质量作任何法律背书。

建议在沙箱或测试环境中充分验证后，再部署至生产环境，并做好必要的安全评估。

📄 License 说明

🔗 相关工具推荐

LLM对齐模板

Prompt模板

generative-ai-for-beginners Prompt模板

包含21堂课程的开源学习资源，涵盖Prompt工程、ChatGPT、DALL-E等生成式AI技术。提供Jupyter N

Prompt工程完整指南

全面的提示词工程学习资源库，包含指南、论文、课程和笔记本。适合AI爱好者、开发者和研究人员深入学习提示词设计、Agent

awesome-ai-system-prompts — AI Agent 工作流中文教程

精选汇总ChatGPT、Claude等主流AI工具的系统提示词集合。专为AI智能体构建者和提示词工程师打造，包含完整的提

📚 相关教程推荐

AI 写作提效工作流：从 Prompt 设计到批量内容生产

帮助中心 · AI Skill Hub

AI Agent 工作流设计模式：从单 Agent 到多 Agent 协作的实践指南

帮助中心 · AI Skill Hub

📰 相关 AI 新闻

AI Agent 自主化能力最新进展

AI 资讯 · 知识关联

AI 前沿资讯：If LLMs Have Human-Like Attrib…

AI 资讯 · 知识关联

AI 前沿资讯：Is your AI strategy burning ca…

AI 资讯 · 知识关联

AI Agent 自主化能力最新进展

AI 资讯 · 知识关联

🍿 AI 圈相关吃瓜

配了5个 MCP 工具，Claude 一个都没用

AI 圈观察

AutoGPT 自主完成了任务：把我的文件夹全部重命名了

AI 圈观察

Filesystem MCP 帮 Claude 找文件，找了整个 node_modules

🗺️ 相关解决方案

ai-workflow-templates

cli

cli-productivity

🧩 你可能还需要

基于当前 Skill 的能力图谱，自动补全的工具组合

total-agent-memory MCP工具

为Claude Code和Codex CLI提供持久化记忆功能的开源MCP工具。自动提取知识图谱，支持多轮对话上下文保留，适合需要长期记忆和

natively-cluely-ai-assistant — Claude Skill 中文使用文档

免费开源的AI面试助手，实时转录，隐蔽模式，局部RAG，BYOK。无订阅，防止数据泄露。

kb-arena开源AI工作流

kb-arena是开源的AI工作流，用于Benchmark 9 retrieval architectures（向量、上下文、QnA、知识图

❓ 常见问题 FAQ

oh-my-knowledge 是什么工具？−

oh-my-knowledge 是一款TypeScript开发的AI辅助工具。开源Prompt模板：Evaluation framework for LLM knowledge inputs — prompts, RAG corpora, skills, ag。⭐6 · TypeScript 主要应用场景包括：评估LLM模型的知识输入能力。

oh-my-knowledge 如何安装和开始使用？+

oh-my-knowledge 是否免费？许可证是什么？+

oh-my-knowledge 适合哪些用户使用？+

oh-my-knowledge 的社区活跃度和项目维护状况如何？+

这个 Prompt 模板适合哪些 AI 工具使用？+

Prompt 模板中的占位符应该如何替换？+

如果 AI 输出的结果不符合预期，该怎么调整？+

💡 AI Skill Hub 点评

总体来看，智能提示评估是一款质量良好的Prompt模板，在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态，建议收藏备用，结合自身场景选择合适时机引入使用。

⬇️ 获取与下载

⬇ 下载源码 ZIP

✅ MIT 协议 · 可免费商用 · 直接从 aiskill88 服务器下载，无需跳转 GitHub

📚 深入学习智能提示评估

查看分步骤安装教程和完整使用指南，快速上手这款工具

⚙️ 安装教程 📚 使用教程

🌐 原始信息

原始名称	`oh-my-knowledge`
原始描述	开源Prompt模板：Evaluation framework for LLM knowledge inputs — prompts, RAG corpora, skills, ag。⭐6 · TypeScript
Topics	`AILLMbenchmarkprompt`
GitHub	https://github.com/lizhiyao/oh-my-knowledge
License	MIT
语言	TypeScript

🔗 原始来源

🐙 GitHub 仓库 https://github.com/lizhiyao/oh-my-knowledge 🌐 官方网站 https://www.npmjs.com/package/oh-my-knowledge

收录时间：2026-06-01 · 更新时间：2026-06-01 · License：MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。

智能提示评估

📚 深度解析

📋 工具概览

📖 中文文档

oh-my-knowledge

Features

Requirements

Quick start

Environment variables

Why omk over alternatives

⚡ 核心功能

👥 适合人群

🎯 使用场景

⚖️ 优点与不足

🔗 相关工具推荐

❓ 常见问题 FAQ

🤖 交给 Agent 安装 · 智能提示评估