Master Orchestrator

让 Claude Code 和 Codex 协作处理大型编码任务。自动把目标拆成 DAG,跨 Agent 并行执行,并收敛到可验证结果。

单 Agent 编码的瓶颈

大型任务会压垮单次 AI 会话,最后往往变成人工拼接多个结果。

🚨

上下文溢出

重构 15 个文件时,单 Agent 很容易忘掉前面改过什么,导致 import 不一致、接口不匹配、依赖遗漏。

🔄

缺少并行能力

独立任务只能串行跑。100 个文件的小修复本来可以几分钟完成,却会被拖成几十分钟。

🤔

工具不匹配

规划需要推理能力,执行需要吞吐和稳定性。让同一个模型包揽所有阶段,效果通常会打折。

🔀

人工协调成本高

你需要自己启动多个 Agent、检查输出、传递上下文、处理失败。这不是真正的自动化。

Master Orchestrator 如何解决

一个命令完成目标分解、并行执行、交叉验证和结果收敛。

输入
你的目标
自然语言
阶段 1
分解
Claude
阶段 2
执行
Codex 并行
阶段 3
审查
Claude
输出
已验证
测试与合并
# 一个命令替代反复手工调度
$ mo do "添加 JWT 鉴权,包括中间件、路由、测试和文档"

# 正在把目标分解为 6 个任务...
# 任务 1: auth-middleware (claude) - running
# 任务 2: token-utils (codex) - running
# 任务 3: auth-routes (codex) - waiting [depends: 1,2]
# 任务 4: auth-tests (codex) - waiting [depends: 1,3]
# 任务 5: api-docs (codex) - waiting [depends: 3]
# 任务 6: integration-review (claude) - waiting [depends: 4,5]

# 6 个任务全部完成,失败 0 个,用时 4 分 23 秒

单 Agent 对比 Master Orchestrator

能力 单 Agent Master Orchestrator
多文件重构 上下文溢出,改动不一致 DAG 分解,并行执行
100+ 文件批量操作 串行执行,失败靠手工重跑 16 并发 worker,自动重试
错误恢复 人工重启 错误分类、退避、降级
Provider 灵活性 只能绑定一个模型 按阶段混用 Claude 和 Codex
收敛检测 缺失 检测停滞、回归和质量劣化
崩溃恢复 从头再来 检查点和 resume

核心能力

DAG 任务分解

自动把目标拆成有依赖关系的子任务,没有依赖冲突的任务会并行执行。

Provider 路由

按阶段选择最合适的 AI Agent:Claude 做推理规划,Codex 做代码执行。

Simple 模式

面向批量小任务的高吞吐执行,支持 16 并发 worker、自动重试和语法验证。

错误识别

识别限流、上下文溢出、临时失败等类型,并应用对应恢复策略。

收敛检测

监控停滞、回归和质量劣化,必要时升级策略或回滚到稳定状态。

崩溃恢复

使用 SQLite 保存检查点,中断后可以从上次进度继续。

预算控制

按 provider 设置预算上限,并通过 accounting 模式记录消耗。

自我改进

可以分析自己的运行记录,并为项目工作流提出改进建议。

可扩展配置

基于 TOML 配置 provider、路由、重试策略和验证规则。

30 秒上手

# 安装
$ git clone https://github.com/amber132/Master-Orchestrator.git
$ cd Master-Orchestrator
$ pip install -e ".[dev]"

# 运行第一个编排任务
$ mo do "给所有 POST 接口补充输入校验"