Librarian 升级 — 在你打开 wiki 之前,跨源综合已经做完、矛盾已经标红、判断点已经摆好。
一家公司的信息散布在十几种来源里——
传统做法:在需要的时候靠记忆或临时搜索把它们拼起来。
拼不完整是常态。拼错是风险。
PM 最稀缺的从来不是信息时间,是判断时间——但传统工作流让你把判断时间花在了拼信息上。
| 维度 | 传统 AI 投研工具被动记忆系统 | Investor Harness v0.9主动投研助手 |
|---|---|---|
| 触发方式 | 你问什么它答什么 | 每天主动扫 vault、刷新 wiki、跑健康检查 |
| 信息状态 | 静态笔记,停在上次 session | 活的信息流,7 桶 daily feed |
| 会前准备 | 翻 session log,靠记忆 | question list 自动附 vault 扫描结论 |
| 矛盾处理 | 出报告时回头检查 | 每天扫,差异 >5% 标红 |
| 认知偏差 | 见完客户才发现自己记错 | 会前 vault 摆数字,矛盾立刻暴露 |
| 研究复利 | 每次从零开始 | wiki v1 → v2 → v3,三个季度后认知厚度 |
机器擅长的活——穷举扫描、规则仲裁、写 diff 日志。
人留人擅长的活——判断哪个来源在当前 context 下更可信、哪个 gap 背后藏着 alpha。
这不是单点工具,是一整套自我维护的研究工作流——每次研究活动都在强化下一次的起点。
focus list 上每家公司一份 wiki page,14 段结构固定——任何一家公司打开就能直接读,结构记忆零成本。
§3 Valuations 每天活的:librarian 每天拉股价,按 当天股价 / 模型基准股价 整体缩放 EV/PE/EV-EBITDA——"今天股价多少、对应估值多少"自动化。
§2 Model Snapshot 走 registry:30+ 数据点注册在 Excel 模型 tab/row,模型更新自动 diff——wiki 不会悄悄过期。
| §1 | Snapshot | 季度 |
| §2 | Model Snapshot | registry 触发 |
| §3 | Valuations 实时 | 每天 |
| §4 | Key Take-Away 7 桶 | 每天 |
| §5 | 关键指引 Key Guidance | 业绩会触发 |
| §6 | Known Truth | 低频 |
| §7 | Analyst Ratings | 每周 |
| §8 | 近期 Thesis | 月度 |
| §9 | 催化剂日历 | 滚动 |
| §10 | Q&A 存档 | 每次会议 |
| §11 | 调研纪要索引 | visiting |
| §12 | 关键风险与退出条件 | 月度 |
| §13 | Diff Log | 自动 |
| §14 | 仍需补的资料 | 滚动 |
每天扫 vault 近 90 天窗口,按文件名 token + frontmatter 分类,塞进 7 个桶。研究活动桶置顶——打开 wiki 第一眼看到的不是过去新闻,而是"我们最近在做什么"。
本质上是把 librarian 当成每天替你跑搜索引擎的 RA——同样一组 query,一年 365 天稳定跑,覆盖率远高于"今天该去 google 一下"。
做 IC Memo 时回答了关键问题:"过去一个季度我们在这家公司上做了什么工作",不用翻 session log。
见分析师 / 管理层之前:建 question list 文件,列出问题。
librarian 对 vault 做全量扫描,每个问题下面自动附"vault 扫描初步结论"。
打印出来就是一份完整的会前 briefing。
最大副作用 = 最大价值:vault 扫描经常主动纠正你的认知偏差——你以为的数字和 vault 里实际能找到的数字经常有出入。系统把两个数字摆在一起,矛盾立刻暴露。
这种纠正如果在会上才发生,代价就大了。
Q1: FY26 出海销量目标?
vault 已知:
- 20260315 FY25 全年电话会
→ 30k 单位 (B 级 / 管理层口径)
- 20260410 GS 研报
→ 推算 28k 单位 (B 级 / 卖方推算)
- model FY26
→ 当前假设 32k 单位 (A 级)
矛盾点:管理层 30k vs 模型 32k
差 6.7%
建议追问:32k 的差额是否来自
下半年新客户?哪些已签 LOI?
问题 → 答案 → 存档
带路由方式、来源 wikilink、置信度评分。高置信度答案下次直接复用,低置信度等更好来源覆盖。
答案 → wiki → 下次提问上下文
答案更新 wiki 对应段落。下次 vault 扫描时,新内容自动成为下个 question list 的背景知识。
复利
每一轮:wiki 厚一层,question list 起点高一层,问题更精准,答案更有价值。
三个季度下来,一家公司的 wiki page 不再是"材料汇总",而是一份经过反复交叉验证、带完整研究脉络的知识资产。
每天两层健康检查 + 跨源矛盾扫描。
触发 WARNING 后系统写 flag,下次上线 LLM 把整页过一遍。
每天对比同一家公司多个来源:
差异 > 5% 自动标记
| 层 | QC 名 | 做什么 |
|---|---|---|
| 1 | 数据入口 QC | 每个数据点入库时就标 A/B 级 + 来源 wikilink。不是用的时候才想起来标。 |
| 2 | 注册表 QC | 模型数字通过 registry 追踪,模型更新自动 diff。wiki 不会出现"模型更新了但页面还是旧数字"。 |
| 3 | 格式 QC | 12 条硬规则。表格不能空、来源必须 wikilink、年度季度不混表... 每次更新自动 lint,不通过不算完成。 |
| 4 | 时效 QC | 健康检查每天巡查六项,TP / 研报 / 催化剂 / 财报日期全覆盖。 |
| 5 | 交叉 QC | vault 扫描生成 question list 时主动对比来源,差异 >5% 标记。 |
到出 IC Memo 或做 PPT 的时候——数据已经验证过,来源已经标注过,前后一致性已经保证过。
最终输出物的质量和一致性,是过程的自然结果,不是事后修补的产物。
被老板催着看 AUTO 出海,临时 onboard 某 OEM,从零到持续跟踪。
framing sm-thesis · sm-industry-map
research sm-company-deepdive · sm-earnings-preview · sm-model-check · sm-consensus-watch
monitoring sm-catalyst-monitor · sm-roadshow-questions
challenge sm-red-team
output sm-pm-brief · sm-briefing
technical sm-tape-review
batch sm-batch-refresh · sm-batch-earnings · sm-catalyst-sweep
entry sm-master · sm-autopilot
sm-wiki-build | 新建 coverage → 14 段 wiki |
sm-daily-feed | 7 桶日刷 |
sm-question-list | 会前 vault 扫描 |
sm-health-check | 双层健康 + 跨源仲裁 |
sm-qa-archive | 会后归档 + 级联 |
需要用户明示触发
("建 coverage / 起 wiki / 刷 daily / 跑健康检查 / 会后归档"),
不在 sm-autopilot 默认路由内。
claude.ai/code)curl -sSL https://raw.githubusercontent.com/\ joansongjr/investor-harness/main/install.sh \ | bash
不会装 Claude Code?现场我演示。
github.com/joansongjr/investor-harness
跨源综合自动做完。打开 wiki page 看到的是已经验证过、标注好来源的事实集合,不是一堆原始材料。
见客户前 question list 自动附 vault 扫描结论。你以为你知道的和库里实际有的摆在一起——会上不会被打脸。
"过去一个季度我们在这家公司做了什么"——§4 🔬 桶清楚列着每一次研究活动。IC Memo 不用回忆。
v0.9.0 · MIT License · A 股 / 港股 / 美股 / 公募 / 跨市场
支持 Claude Code · Codex · OpenCode · OpenClaw · Generic markdown harness
问题、issue、PR 都欢迎。
分享人:宋婧茹 · 兴业证券海外研究 · 2026 / 05