AI Skill Hub 推荐使用:参数忠实性研究工具 是一款优质的AI工具。AI 综合评分 7.2 分,在同类工具中表现稳健。如果你正在寻找可靠的AI工具解决方案,这是一个值得深入了解的选择。
专注于思维链、模型忠实性和遗忘学习的开源研究工具。提供LLM/NLP复现研究框架,支持Jupyter交互式分析。适合AI研究者、NLP从业者进行模型行为分析和可解释性研究。
参数忠实性研究工具 是一款基于 Jupyter Notebook 开发的开源工具,专注于 思维链、模型忠实性、机器遗忘 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
专注于思维链、模型忠实性和遗忘学习的开源研究工具。提供LLM/NLP复现研究框架,支持Jupyter交互式分析。适合AI研究者、NLP从业者进行模型行为分析和可解释性研究。
参数忠实性研究工具 是一款基于 Jupyter Notebook 开发的开源工具,专注于 思维链、模型忠实性、机器遗忘 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
# 克隆仓库 git clone https://github.com/kiangyeeo/parametric-faithfulness cd parametric-faithfulness # 查看安装说明 cat README.md # 按 README 完成环境依赖安装后即可使用
# 查看帮助 parametric-faithfulness --help # 基本运行 parametric-faithfulness [options] <input> # 详细使用说明请查阅文档 # https://github.com/kiangyeeo/parametric-faithfulness
# parametric-faithfulness 配置说明 # 查看配置选项 parametric-faithfulness --config-example > config.yml # 常见配置项 # output_dir: ./output # log_level: info # workers: 4 # 环境变量(覆盖配置文件) export PARAMETRIC_FAITHFULNESS_CONFIG="/path/to/config.yml"
This project is a group assignment for the NLP & LLM course (Spring 2026) .
This project aims to conduct an in-depth investigation into parametric faithfulness in the reasoning steps of large language model Chain of Thought (CoT). We primarily focus on the FUR (Faithfulness by Unlearning Reasoning steps) method proposed by Tutek et al. (2025) , and our core work is divided into the following two parts:
conda activate pf
pip install -r requirements.txt
python -m spacy download en_core_web_sm
python -c "import nltk; nltk.download('punkt'); nltk.download('punkt_tab')"
Tips: If you are using Qizhi (http://qz.cfff.fudan.edu.cn/), you can directly use the environment we make by conda activate pf.
export HF_TOKEN=hf_xxxxxx
Tips: Apply for your access to visit Llama-3.2-3B in https://huggingface.co/meta-llama/Llama-3.2-3B-Instruct. If you are using Qizhi (http://qz.cfff.fudan.edu.cn/), you can ignore this part because we have download the model on the server.
PRE=1 bash repro/run_all.sh
The CoT & noCoT results will be saved in ./final_cot.
bash repro/run_all.sh
# If you want to run them in parallel, instead, run them separately
python -m repro.run_repro --short_model Phi-3 --dataset openbook --lr 1e-4
python -m repro.run_repro --short_model Phi-3 --dataset sqa --lr 5e-5
python -m repro.run_repro --short_model LLaMA-3-3B --dataset openbook --lr 3e-5
python -m repro.run_repro --short_model LLaMA-3-3B --dataset sqa --lr 3e-5
Unlearn results will be saved in ./final_results.
set GEMINI_API_KEY=your_google_api_key
jupyter notebook "Adding mistakes repro.ipynb"
python mistakes_repro.py --short_model Phi-3 --dataset openbook
python mistakes_repro.py --short_model Phi-3 --dataset sqa
python mistakes_repro.py --short_model LLaMA-3-3B --dataset openbook
python mistakes_repro.py --short_model LLaMA-3-3B --dataset sqa
The notebook will write injected mistakes to ./mistake_results. Evaluation results will be written to ./mistake_stats.
python repro/compute_metrics.py
The results will be save in repro/metrics_summary.csv and repro/metrics_summary.json.
---
学术研究导向的专业工具,聚焦LLM忠实性和可解释性前沿问题。代码质量和文档完整度有待提升,适合研究社区使用。
该工具使用 BSD-2-Clause 协议,商用场景请仔细阅读协议条款,必要时咨询法律意见。
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
✅ BSD 2-Clause — 极度宽松,几乎可以任意使用,仅需保留版权声明。
总体来看,参数忠实性研究工具 是一款质量良好的AI工具,在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态,建议收藏备用,结合自身场景选择合适时机引入使用。
| 原始名称 | parametric-faithfulness |
| 原始描述 | 开源AI工具:chain-of-thought, faithfulness, unlearning, llm、nlp, reproduction-study。⭐7 · Jupyter Notebook |
| Topics | 思维链模型忠实性机器遗忘LLM研究复现研究 |
| GitHub | https://github.com/kiangyeeo/parametric-faithfulness |
| License | BSD-2-Clause |
| 语言 | Jupyter Notebook |
收录时间:2026-06-04 · 更新时间:2026-06-11 · License:BSD-2-Clause · AI Skill Hub 不对第三方内容的准确性作法律背书。