在线蒸馏论文工具库 是 AI Skill Hub 本期精选AI工具之一。综合评分 7.8 分,整体质量较高。我们推荐使用将其纳入你的 AI 工具库,帮助提升工作效率。
精选在线策略蒸馏相关论文、技术报告、框架和工具的综合集合。涵盖知识蒸馏、GKD等前沿技术,为研究员和开发者提供系统的学习资源和实现工具,助力模型压缩和优化研究。
在线蒸馏论文工具库 是一款基于 Python 开发的开源工具,专注于 知识蒸馏、模型压缩、策略蒸馏 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
精选在线策略蒸馏相关论文、技术报告、框架和工具的综合集合。涵盖知识蒸馏、GKD等前沿技术,为研究员和开发者提供系统的学习资源和实现工具,助力模型压缩和优化研究。
在线蒸馏论文工具库 是一款基于 Python 开发的开源工具,专注于 知识蒸馏、模型压缩、策略蒸馏 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
# 克隆仓库 git clone https://github.com/chrisliu298/awesome-on-policy-distillation cd awesome-on-policy-distillation # 查看安装说明 cat README.md # 按 README 完成环境依赖安装后即可使用
# 查看帮助 awesome-on-policy-distillation --help # 基本运行 awesome-on-policy-distillation [options] <input> # 详细使用说明请查阅文档 # https://github.com/chrisliu298/awesome-on-policy-distillation
# awesome-on-policy-distillation 配置说明 # 查看配置选项 awesome-on-policy-distillation --config-example > config.yml # 常见配置项 # output_dir: ./output # log_level: info # workers: 4 # 环境变量(覆盖配置文件) export AWESOME_ON_POLICY_DISTILLATION_CONFIG="/path/to/config.yml"
<p align="center"> <a href="https://awesome.re"><img src="https://img.shields.io/badge/Awesome-%E2%9A%97%EF%B8%8F_On--Policy_Distillation-000000?style=for-the-badge&labelColor=000000" alt="Awesome On-Policy Distillation"></a> </p>
<p align="center"> <a href="#contents"><img src="https://img.shields.io/badge/Entries-223-000000?style=for-the-badge&labelColor=000000" alt="Entries"></a> <a href="https://github.com/chrisliu298/awesome-on-policy-distillation/stargazers"><img src="https://img.shields.io/github/stars/chrisliu298/awesome-on-policy-distillation?style=for-the-badge&logo=github&logoColor=white&label=Stars&labelColor=000000&color=000000" alt="GitHub Stars"></a> <a href="https://github.com/chrisliu298/awesome-on-policy-distillation/network/members"><img src="https://img.shields.io/github/forks/chrisliu298/awesome-on-policy-distillation?style=for-the-badge&logo=github&logoColor=white&label=Forks&labelColor=000000&color=000000" alt="GitHub Forks"></a> <a href="https://github.com/chrisliu298/awesome-on-policy-distillation/commits"><img src="https://img.shields.io/github/last-commit/chrisliu298/awesome-on-policy-distillation?style=for-the-badge&logo=github&logoColor=white&label=Last%20Commit&labelColor=000000&color=000000" alt="Last Commit"></a> </p>
A curated collection of papers, technical reports, frameworks, and tools for on-policy distillation (OPD) of large language models.
On-policy distillation trains a student on samples from its own evolving policy, while a teacher (external, privileged, or self-conditioned) provides dense supervision on those same samples.
On-policy distillation (OPD) trains a student on trajectories sampled from its own policy while a teacher scores the student-visited prefixes with dense token-level guidance. This on-policy data collection reduces the train-inference distribution gap that affects off-policy KD/SFT on fixed traces. Depending on the estimator, OPD looks like GKD on student rollouts or policy-gradient/RL with teacher-defined per-token KL/log-prob rewards, making the natural contrast sparse outcome-reward RL rather than RL as a whole. As of 2026, OPD is a standard post-training primitive at Alibaba (Qwen3), DeepSeek (V4), Xiaomi (MiMo), Zhipu (GLM-5), NVIDIA (Nemotron-Cascade 2), and others.
Shipping today? Jump to Frameworks and Implementations. New to OPD? Read Start Here.
OPD applied to non-text-reasoning settings — agents, multimodal models, diffusion, audio, robotics — and to inference acceleration via speculative decoding. These pass the inclusion criterion (student rollouts central to the learning signal) but on substrates beyond LLM text reasoning.
精心编纂的蒸馏领域资源库,汇聚高质论文和实用工具。更新维护良好,社区活跃度中等,是该领域学习者的重要参考。
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
✅ CC0 1.0 — 公共领域贡献,完全放弃版权,无任何使用限制。
经综合评估,在线蒸馏论文工具库 在AI工具赛道中表现稳健,质量良好。如果你已有明确的使用需求,可以直接上手体验;如果还在评估阶段,建议对比同类工具后再做决策。
| 原始名称 | awesome-on-policy-distillation |
| Topics | 知识蒸馏模型压缩策略蒸馏GKD研究资源 |
| GitHub | https://github.com/chrisliu298/awesome-on-policy-distillation |
| License | CC0-1.0 |
收录时间:2026-05-24 · 更新时间:2026-05-24 · License:CC0-1.0 · AI Skill Hub 不对第三方内容的准确性作法律背书。