🎬 交互式动画目录

Agent 学习教程 — 5 个核心概念的可视化解释

1
🔄 PTA 循环
第 1 章 · Agent 架构
感知-思考-行动循环动画。模拟 Agent 在真实场景(天气查询 + 条件发邮件)中如何运行完整的反馈控制回路。
核心基石
2
🔗 ReAct 推理
第 6 章 · 推理与规划
Thought → Action → Observation 的三方对比演示。同时展示 ReAct、纯 CoT、Act-only 三种模式解决同一个多跳问答。
思考框架
3
📚 RAG 工作流程
第 7 章 · 检索增强生成
从文档分块 → 向量化 → 相似度搜索 → Prompt 组装 → LLM 生成的完整 5 阶段流水线动画,含向量空间可视化。
热门技术
4
🔧 Function Calling
第 4 章 · 工具使用
5 步通信协议的三栏动画。模拟用户-LLM-工具引擎之间的"乒乓球"式消息传递,含多轮工具调用。
核心机制
5
🎯 GRPO 组内采样
第 18 章 · Agentic RL
DeepSeek 的高效 RL 算法动画。展示 G=8 个回答的采样、奖励打分、组内标准化、策略概率更新全过程。
前沿算法