V5.0 Pipeline Token成本计算器
PER-STAGE TOKEN COST BREAKDOWN · FULL PIPELINE SIMULATION
① 每日输入量
摄取层
文章/网页数量
20
平均文章长度 (tokens)
1,500
视频转录数量
3
平均转录长度 (tokens)
4,000
Layer 2 处理
每日主动LLM调用次数
10
平均输出长度 (tokens)
800
Layer 3 行动层
深度研究/产出任务数
2
产出平均长度 (tokens)
3,000
② 主模型选择
Layer 2/3 主要调用模型(per M tokens)
Claude Haiku
$0.80 / $4.00
Claude Sonnet
$3.00 / $15.00
Claude Opus
$15.00 / $75.00
GPT-4o
$2.50 / $10.00
GPT-4o mini
$0.15 / $0.60
Gemini 1.5 Pro
$1.25 / $5.00
* 价格仅供估算参考,请以官方文档为准。漏斗过滤和嵌入使用轻量模型/本地方案。
F
知识漏斗:内容分类过滤
(轻量模型 Haiku)
$0.00
步骤
输入Tokens
输出Tokens
成本/天
F1 稀缺性分类 (100%素材)
-
-
-
F2 价值度评分 (60%通过)
-
-
-
F3 时效性裁切 (40%→24%)
-
-
-
全量素材
0
件
→F1→
稀缺信号
0
件 60%
→F2→
高价值
0
件 40%
→F3→
进行动
0
件 ~12%
2
Layer 2:Context组装 + LLM处理
$0.00
组件
输入Tokens
输出Tokens
成本/天
Schema (P0 · 25% ctx)
-
—
-
RAG结果 (P1 · 40% ctx)
-
—
-
Log.md (P2 · 20% ctx)
-
—
-
System Prompt (15% ctx)
-
—
-
LLM输出 (×调用次数)
—
-
-
■
Schema
■
RAG
■
Log
■
System
3
Layer 3:深度研究 + 产出生成
$0.00
步骤
输入Tokens
输出Tokens
成本/天
研究Context (RAG+Schema)
-
—
-
产出生成 (商业计划/代码/模型)
—
-
-
Closure回流 (摘要压缩写入)
-
-
-
E
向量嵌入:Vector DB写入
(text-embedding-3-small)
$0.00
内容
Tokens量
—
成本/天
漏斗通过素材嵌入 (~12%)
-
—
-
Closure产出回流嵌入
-
—
-
* 本地方案(ChromaDB+nomic-embed)成本≈$0,但需GPU或接受较慢速度
⊕ 总成本汇总
$0.00
每日
$0.00
每周
$0.00
每月
$0.00
每年
⚡ 优化建议(当前参数)
漏斗节省: 计算中...
模型选择: 计算中...
缓存策略: Schema+System Prompt启用缓存可节省约
$0
/月
嵌入优化: 本地部署可节省
$0
/月