Jarvis Agent Factory

多智能体 AI 编程助手配置工厂 — 从想法到交付的完整软件开发流水线
仅支持 Claude Code · 46 MCP 工具 · 34 指令 · 72 智能体 · 35 技能 · 15 流水线
v4.7.6
34
指令 Commands
72
智能体 Agents
35
技能 Skills
15
流水线 Pipelines
62
闸门 Gates

一、Jarvis 是什么

Jarvis Agent Factory(贾维斯智能体工厂)是一套面向 Claude Code 平台的多智能体配置工程。它不是业务应用代码,而是配置 + 引擎——安装后,Claude Code 获得一套完整的 FSM(有限状态机)编排系统,将软件开发从"手动编码"升级为"编排驱动"。

二、快速开始

3 步开始:

1. npm i -g jarvis-agent-factory — 安装 CLI(零原生依赖,Node 22.5+ 内置 node:sqlite)

2. jarvis init -y — 一键部署配置 + MCP + 钩子到当前项目

3. 重启 Claude Code → 引擎自动拉起 → 输入 /auto 你的任务 开始使用

不确定用什么指令?直接用 /auto——自动检测 12 种任务类型 → 路由最优流水线 → 跳过无关 Gate → 按复杂度分配 Agent。99% 的情况用它就够了。

三、架构模型

用户 → 指令 → 引擎 → Agent → 产物
用户输入
/jarvis "需求"
指令模板
34 条命令
编排引擎
FSM + SQLite
72 个 Agent
专业 spawn
35 个 Skill
行为规范
文档产物
.jarvis/日期/

引擎内部组件

组件职责
MCP stdio 服务通过 MCP 协议与 Claude Code 通信,暴露 46 个编排工具
FSM 闸门引擎强制执行 Gate 序列——跳过/回退一律拒绝
SQLite WAL 数据库会话管理、流水线运行、SSE 事件日志、跨会话持久化
REST API + Web 面板端口 3456,提供看板/Agent 配置/归档/指令列表
SSE 实时推送Gate 进度、会话变更、运行状态实时推送到 Web 面板
模板安装器 CLIjarvis init/upgrade — Hash 对比增量更新,保护用户自定义

四、编排原理

核心概念

指令(Command)是用户交互入口。用户输入 /jarvis 并描述任务,编排者读取指令模板,按模板定义的步骤执行编排。

流水线(Pipeline)是预定义的 Gate 序列。引擎通过 PIPELINE_DEFS 知道每条流水线有哪些 Gate、顺序、是否允许跳转。

闸门(Gate)是 FSM 检查点。编排者调用 gate_check 验证操作权限,通过后 gate_enforce 记录检查点,然后 advance_gate 推进。

Agent spawn在特定 Gate 发生——Gate B1 spawn 架构师,Gate C-impl spawn 实现 Agent。通过 TeamCreate(团队模式)或 Agent 工具(子智能体模式)调度。

技能(Skill)是 Agent 的行为规范。每个 Agent 启动时调用 Skill("behavioral-guidelines") 加载行为准则。

编排流程: 用户输入 → 指令模板加载 → session_join 注册 → pipeline_guide 获取指引 → gate_check 验证权限 → 执行工作 → gate_enforce 确认 → advance_gate 推进 → 重复直到最后 Gate

五、流水线体系

5.1 标准流水线

full / frontend / backend / lite 共用此 Gate 序列。每个 Gate 有严格的操作权限表——引擎强制执行,不可绕过。

Gate A
需求
B-DDD
领域
B-BDD
行为
B-TDD
任务
B1
架构
Gate C
规划
C-impl
实现
C1
质量
C1.5
视觉
C2
测试
Gate D
评审
Gate E
发布
Gate阶段做什么允许操作禁止操作
Gate A需求 需求澄清:产出 REQ-XXX 需求文档,5 维度评分。输出到 .jarvis/YYYY-MM-DD/requirements/ read, write_docwrite_code, build, deploy
B-DDD设计 领域驱动分析:识别聚合根/实体/值对象/领域服务 read, write_docwrite_code, build, deploy
B-BDD设计 行为驱动场景:Gherkin Given/When/Then。纯技术逻辑可跳过 read, write_docwrite_code, build, deploy
B-TDD设计 测试驱动任务分解:TASK-XXX 映射 REQ-XXX,指定测试策略 read, write_docwrite_code, build, deploy
Gate B1架构 架构评审(条件性):spawn 对应架构师,产出评审报告 read, write_doc, sweep_archwrite_code, build, deploy
Gate C规划 planner 产出 parallel_batches 并行任务分组,决定 Team vs Subagent 调度 read, write_doc, spawn_implspawn_test, build, deploy
C-impl实现 Team 模式 spawn 多个实现 Agent 并行编码,产出 <TASK-ID>-completion.md read, write_code, spawn_implspawn_test, build, deploy
Gate C1质量 Lint + Type-check + Build + Deps Audit 全部通过。不通过自动修复 ≤2 轮 read, lint, build, fixspawn_impl, deploy, write_code
C1.5视觉 视觉验证(条件性):截图对比。纯后端/算法任务可跳过 read, preview, fixspawn_impl, deploy, write_code
Gate C2测试 Team 模式 spawn 测试 Agent,最多 5 次重试,产出测试报告 read, spawn_test, fixspawn_impl, deploy, write_code
Gate D评审 Team 模式 spawn 审查 Agent,分级审查报告。修复后重检 ≤2 轮 read, review, audit, fixspawn_impl, deploy, write_code
Gate E发布 质量重检 → 版本递增 → CHANGELOG → commit+tag+push → CI 自动发布 read, deploy, write_docwrite_code, spawn_impl, lint
关键设计:Gate 操作权限表是硬约束——引擎在 gate_check 时比对操作与当前 Gate 的允许列表,不匹配直接拒绝。Gate A 阶段无法写代码,Gate E 阶段无法改实现。这就是"规范驱动、文档驱动的严格工程化流水线"的技术基础。

5.2 全部 15 条流水线

指令流水线Gate 序列门数适用场景
/jarvisfullA→B-DDD→B-BDD→B-TDD→B1→C→C-impl→C1→C1.5→C2→D→E13中大型功能开发,全部 Gate 强制执行
/frontendfrontend同上,C1.5 视觉验证强制,前端专属 Agent13前端开发,React/Vue/Angular
/backendbackend跳过 C1.5,后端专属 Agent11后端开发,API/数据库/业务逻辑
/autolite支持 gate_jump 跳过无关 Gate,智能路由13日常默认入口,99% 情况用它
/mobilefrontend同上,平台感知 Agent 选择(6 平台)13移动端/跨端开发
/refactorrefactorR1(边界)→R2(基线)→R3(重构)→R4(漂移检测)→R5(报告)5代码重构,失败自动回滚
/hotfixhotfixH0(声明+审批)→H1(最小修复)→H2(验证+回滚)→H3(审计)4紧急故障恢复
/migratemigrateM1(规则)→M2(迁移)→M3(编译)→M4(Lint修复)4框架升级、依赖替换
/evaluateevaluateE0(标准)→E1(原型)→E2(指标)→E3(报告)4技术选型、方案对比
/debugdebugD0(信息)→D1(复现)→D2(调试)→D3(诊断)→D4(报告)5异常排查、根因定位
/researchresearchRS0(课题)→RS1(收集)→RS2(分析)→RS3(验证)→RS4(报告)5技术调研、方案研究
/releasereleaseRL0(环境)→RL1(质量)→RL2(版本)→RL3(发布)→RL4(验证)5快速发布
/askaskK0(模式)→K1(收集)→K2(分析)→K3(产出)4需求探询 4 模式自适应
/simplifysimplifyS0(分析)→S1(简化)→S2(回归)→S3(报告)4代码质量清理
/tracetraceT0(框架)→T1(假设2-5)→T2(证据)→T3(贝叶斯>70%)→T4(方案)5复杂根因因果追踪
/improveimproveIM0(目标)→IM1(研究)→IM2(计划)→IM3(执行)→IM4(迭代)5度量驱动迭代改进

六、全部 34 条指令

编排入口(2 条)

/jarvis
全流程严格模式 — 13 Gate 全部强制执行。从需求到发布的完整生命周期,适合中大型功能开发。
流水线:full(13 Gate)
/auto 日常默认
智能路由模式 — 自动检测 12 种任务类型→路由最优流水线→跳过无关 Gate→按复杂度分配 Team/Subagent。
流水线:lite(支持 gate_jump)

平台开发(3 条)

/frontend
前端开发 — C1.5 视觉验证强制。使用 frontend 专属 Agent 组。
流水线:frontend(13 Gate)
/backend
后端开发 — 跳过 C1.5。使用 backend + database-architect 专属 Agent 组。
流水线:backend(11 Gate)
/mobile --platform=<name>
移动端/跨端统一入口 — 支持 android/ios/flutter/expo/react-native/taro。C1.5 强制。
流水线:frontend 变体(平台感知)

需求与设计(3 条)

/ask
需求探询 — 4 模式:Interview/Direct/Consensus/Review。含 5 维度评分矩阵。
流水线:ask(K0→K1→K2→K3,4 Gate)
/task-design --mode=ddd|bdd|tdd
任务分解(三合一) — 领域驱动/行为驱动/测试驱动。支持链式 ddd→bdd→tdd。
对应:Gate B-DDD/B-BDD/B-TDD
/research
深度研究 — 5 阶段调研。证据矩阵+竞争假设评估。
流水线:research(RS0→RS1→RS2→RS3→RS4,5 Gate)

工程操作(8 条)

/refactor
代码重构安全网 — 定义边界→基线测试→执行重构→行为漂移检测→报告。失败自动回滚。
refactor(R1→R2→R3→R4→R5,5 Gate)
/hotfix
紧急热修复 — 声明+审批→最小化修复→快速验证+回滚→事后审计。
hotfix(H0→H1→H2→H3,4 Gate)
/migrate
框架迁移 — 定义规则→应用迁移→编译验证→自动修复 Lint ≤2 轮。
migrate(M1→M2→M3→M4,4 Gate)
/debug
调试诊断 — 收集信息→复现用例→调试会话→交互诊断→输出报告。
debug(D0→D1→D2→D3→D4,5 Gate)
/trace
贝叶斯因果追踪 — 问题框架→竞争假设(2-5)→证据收集→贝叶斯更新(>70%置信度)→方案。
trace(T0→T1→T2→T3→T4,5 Gate)
/evaluate
技术评估 — 定义标准→生成原型→收集指标→生成报告。适合技术选型、方案对比。
evaluate(E0→E1→E2→E3,4 Gate)
/simplify
代码简化 — 代码分析→简化执行→回归验证→报告产出。消除冗余和死代码。
simplify(S0→S1→S2→S3,4 Gate)
/improve
迭代改进 — 目标定义→研究分析→计划制定→执行验证→评估迭代。度量驱动持续改进。
improve(IM0→IM1→IM2→IM3→IM4,5 Gate)

发布与同步(2 条)

/release
快速发布 — 环境检测→质量门→版本递增→发布执行→发布验证。tag→CI→npm→GitHub Release。
release(RL0→RL1→RL2→RL3→RL4,5 Gate)
/publish
发布上线 — 轻量级发布入口,直接质量重检→版本递增→CHANGELOG→commit+tag+push。
对应:Gate E 快速路径

审查与测试(9 条)

/audit
代码审查 — spawn 审查 Agent,产出分级审查报告(findings + 严重度)。
对应:Gate D
/audit-fix
审查+修复 — 审查后自动修复,修复后重新质量验证 ≤2 轮。
对应:Gate D + 自动修复循环
/test-unit
单元测试 — 运行项目单元测试套件,覆盖率 ≥ 70%。
对应:Gate C2
/test-integration
集成测试 — 验证模块间协作和 API 契约。
对应:Gate C2
/test-e2e
端到端测试 — 模拟真实用户操作流程,浏览器自动化验证。
对应:Gate C2
/test-perf
性能测试 — 测量响应时间/吞吐量/资源消耗。
对应:Gate C2
/test-security
安全测试 — OWASP Top 10 漏洞检查、依赖安全审计。
对应:Gate C2
/browser
浏览器测试与探索 — Playwright 驱动。test-doc-writer→test-executor→remediation 文档驱动闭环。
独立浏览器测试流程
/consult --expert=<name>
架构专家讨论 — 仅方案讨论,不进入流水线。支持 frontend-architect/backend-architect/algorithm-expert。
不进入流水线(纯讨论)

专用工具 + 流程管理(6 条)

/bug-fix
Bug 修复专用流程 — 分析根因→最小化修复→回归验证→修复报告。
对应:full(轻量路径)
/sync
配置同步 — Hash 对比增量更新,保护用户自定义。将 Jarvis 配置同步到目标项目。
不进入流水线(CLI 操作)
/skill-flow
会话流程导出 — 4 子命令:export/save/list/apply。一次执行、永久复用。
不进入流水线(元操作)
/cancel [--leave | --force]
取消流水线运行 — 中止活跃 run→aborted。默认保留会话;--leave 离开;--force 紧急清除。
不进入流水线(会话管理)
/repowiki
项目知识库管理 — 7 子命令:add/ingest/query/list/read/delete/lint。Markdown+YAML 持久化到 .jarvis/wiki/pages/。
不进入流水线(知识管理)
/deepinit [--smart|--full|--incremental]
分层文档初始化 — 按架构层级生成渐进式 AGENTS.md 文档树,同级同步 CLAUDE.md 引导。支持智能检测框架模块。
不进入流水线(文档生成)
/verify
文档驱动验证 — 基于项目 AGENTS.md 层级文档收集证据,确认改动生效可用。PASS/FAIL/GAP 裁决 + 置信度评估。
不进入流水线(独立验证)

七、72 个智能体

实现类(25 个) — Gate C-impl spawn

frontend-devfrontend-uifrontend-state backend-devbackend-apibackend-logicbackend-data android-dev/ui/stateios-dev/ui/state flutter-dev/ui/stateexpo-dev/ui/state react-native-dev/ui/statetaro-dev/ui/state

测试类(15 个) — Gate C2 spawn

frontend-testbackend-test android/ios/flutter/taro/expo/react-native-test browser-testbrowser-use e2e-testperf-testapi-test test-doc-writertest-executor

审查类(16 个) — Gate D spawn

frontend/backend-review android/ios/flutter/taro/expo/react-native-review diff-reviewproject-reviewperf-review security-reviewqa-reviewchange-review audit-onlyaudit-fix-optimize

规划/架构/支撑(15 个)

plannertask-designskill-assignmentremediation-planner frontend-architectbackend-architectdatabase-architectalgorithm-expert code-exploreexternal-resourceapi-contractdocs-engineer infra-deployremediation-expertdocs-research

八、场景推荐

不确定用什么指令?对照你的场景选择:

✨ 新功能开发

日常用 /auto,中大型用 /jarvis(严格 13 Gate)。

🖥️ 前端页面

/frontend,C1.5 视觉验证强制,spawn frontend-dev/ui/state-expert。

🔧 后端 API

/backend,跳过 C1.5,spawn backend-dev/api/logic/data + database-architect。

📱 移动端/跨端

/mobile --platform=android|ios|flutter|expo|react-native|taro 统一入口。

🔨 代码重构

/refactor(5 Gate 安全网),失败自动回滚。

🚨 紧急修复

/hotfix(H0-H3 紧急协议),需要审批确认。

🧹 代码清理

/simplify,消除冗余/死代码/过度抽象,失败自动回滚。

🔍 排查 Bug

简单用 /debug(交互诊断),复杂用 /trace(贝叶斯因果推理)。

⚡ 性能优化

/improve,度量驱动迭代。量化目标→研究→计划→执行→评估→迭代。

📊 技术选型

快速用 /evaluate(原型+指标),深度用 /research(5 阶段分析)。

❓ 需求不清

/ask Interview 模式,Socratic 追问→5 维评分→分析报告+路由建议。

📦 框架升级

/migrate,M1-M4 迁移流程。定义规则→应用→编译→Lint 修复。

📝 代码审查

/audit(只读审查)→ /audit-fix(修复闭环),最多 2 轮。

📤 发布上线

个人用 /release(质量门→CI 自动发布),团队用 /publish(含 PR+审查)。

🧪 测试补齐

/test-unit /test-integration /test-e2e /test-perf /test-security 按需选择。

🛑 取消任务

/cancel 中止当前 run。默认保留会话;--leave 离开;--force 紧急清除。

九、文档驱动体系

Jarvis 的文档驱动有硬编码的目录规范引擎强制的时间戳隔离。所有产物存入 .jarvis/YYYY-MM-DD/{subdir}/

目录对应 Gate产出内容
.jarvis/YYYY-MM-DD/requirements/Gate A需求澄清文档 REQ-XXX
.jarvis/YYYY-MM-DD/tasks/Gate BDDD/BDD/TDD 任务分解文档
.jarvis/YYYY-MM-DD/architecture/Gate B1架构评审报告
.jarvis/YYYY-MM-DD/plans/Gate C执行计划(parallel_batches)
.jarvis/YYYY-MM-DD/implementation/Gate C-implAgent 实现说明 + 自查报告
.jarvis/YYYY-MM-DD/testing/Gate C2测试用例 + 测试报告
.jarvis/YYYY-MM-DD/review/Gate D分级审查报告
.jarvis/YYYY-MM-DD/shipping/Gate E发布记录 + 版本日志

专业流水线也有对应子目录:refactoring/ hotfix/ migration/ evaluation/ debug/ research/ simplification/ trace/ improvement/

硬约束示例:在 Gate A 阶段调用 gate_check({ operation: "write_code" }) → 引擎直接拒绝,因为 Gate A 的允许列表里没有 write_code。必须按顺序产出文档、通过 Gate、推进到 C-impl 阶段才能写代码。这就是"规范驱动、文档驱动的严格工程化流水线"。