经 AI Skill Hub 精选评估,语言模型资源 获评「强烈推荐」。这款AI工具在功能完整性、社区活跃度和易用性方面表现出色,AI 评分 8.0 分,适合有一定技术背景的用户使用。
语言模型资源 是一款基于 Python 开发的开源工具,专注于 chatgpt、gpt-3、gpt-4 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
语言模型资源 是一款基于 Python 开发的开源工具,专注于 chatgpt、gpt-3、gpt-4 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
# 克隆仓库 git clone https://github.com/crazyofapple/Reading_groups cd Reading_groups # 查看安装说明 cat README.md # 按 README 完成环境依赖安装后即可使用
# 查看帮助 reading_groups --help # 基本运行 reading_groups [options] <input> # 详细使用说明请查阅文档 # https://github.com/crazyofapple/Reading_groups
# reading_groups 配置说明 # 查看配置选项 reading_groups --config-example > config.yml # 常见配置项 # output_dir: ./output # log_level: info # workers: 4 # 环境变量(覆盖配置文件) export READING_GROUPS_CONFIG="/path/to/config.yml"
计算的力量: 很多证据表明,机器学习的进步很大程度上是由计算驱动的,而不是研究,请参考:"The Bitter Lesson",而且往往会出现Emergence和Homogenization现象。 有研究表明,人工智能计算使用量大约每3.4个月翻一番,而效率提升每16个月才翻一番。其中计算使用量主要由计算力驱动,而效率则由研究驱动。 这意味着计算增长在历史上主导了机器学习和其子领域的进步。 GPT-4的出现更加证明了这一点。 尽管如此,未来是否有更颠覆Transformer的架构仍需要我们重视,比如说S4。 目前的NLP研究热点大部分基于更先进的LLM (~100B, $10^{23}$ FLOPs)。尤其是ChatGPT通过Alignment技术利用少于预训练几十倍的计算(4.9+60 petaflops/s-days vs 3640 petaflops/s-days)和人类反馈(500k美元, 20k小时,13+33+31k数据,相比于GPT-3的12000k美元 )释放了GPT大模型对话能力并火出圈。所以本库对大规模预训练语言模型LLM相关文章进行追踪和归类,更能让我们把握前沿,看清方向。当然除了【大算力技术基础】,还有其他方面:【大模型技术突破】、【大数据质量提升】、【开放的创新生态环境】、【紧密的团队协作】、【强大的工程能力】等等
--- 论文 (粗糙类别) - 模型训练、测试和优化 - 应用与LLM+ - 原理分析 - 技术改进 - Survey和数据集
资源 - LLM课程 - 重要的图 - LLM Demo - 重要的博客与自选文章 - 训练,推理,应用工具 (未整理) ---
【对GPT-4的测试,limitation】Sparks of Artificial General Intelligence: Early experiments with GPT-4 - Model Card - Video
【InstructGPT论文,包括sft,ppo等,最重要的文章之一】Training language models to follow instructions with human feedback
【scalable oversight: 人类在模型超过自己的任务后怎么持续的提升模型?】Measuring Progress on Scalable Oversight for Large Language Models
【Alignment的定义,deepmind出品】Alignment of Language Agents
A General Language Assistant as a Laboratory for Alignment
【RETRO论文,利用CCA+检索的模型】Improving language models by retrieving from trillions of tokens
Fine-Tuning Language Models from Human Preferences
Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback
【中英文的大模型,超过GPT-3】GLM-130B: An Open Bilingual Pre-trained Model
【预训练目标优化】UL2: Unifying Language Learning Paradigms
【Alignment新的基准,模型库和新方法】Is Reinforcement Learning (Not) for Natural Language Processing?: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization
【通过技术不使用[MASK]标记进行MLM】Representation Deficiency in Masked Language Modeling
【文字转为图像训练,缓解了Vocabulary的需要并抗某些攻击】Language Modelling with Pixels
LexMAE: Lexicon-Bottlenecked Pretraining for Large-Scale Retrieval
InCoder: A Generative Model for Code Infilling and Synthesis
【检索Text相关图像进行语言模型预训练】Visually-Augmented Language Modeling
A Non-monotonic Self-terminating Language Model
【通过prompt设计进行负面反馈比较微调】Chain of Hindsight Aligns Language Models with Feedback
【Sparrow模型】Improving alignment of dialogue agents via targeted human judgements
【用小模型参数加速大模型训练过程(不从头)】Learning to Grow Pretrained Models for Efficient Transformer Training
【多种知识源MoE半参数知识融合模型】Knowledge-in-Context: Towards Knowledgeable Semi-Parametric Language Models
【不同数据集上的多个已训练模型合并方法】Dataless Knowledge Fusion by Merging Weights of Language Models
【很有启发,检索机制代替 Transformer 中的 FFN 的通用架构(×2.54 time),以便解耦存储在模型参数中的知识】Language model with Plug-in Knowldge Memory
【自动生成Instruction tuning的数据用于GPT-3的训练】Self-Instruct: Aligning Language Model with Self Generated Instructions
-
Towards Conditionally Dependent Masked Language Models
【迭代地校准不完美生成的独立校正器,Sean Welleck的后续文章】Generating Sequences by Learning to Self-Correct
【持续学习:新任务增加一个prompt,且上一个任务的prompt和大模型不变】Progressive Prompts: Continual Learning for Language Models without Forgetting
【EMNLP 2022,模型的持续更新】MemPrompt: Memory-assisted Prompt Editing with User Feedback
【新的神经架构 (FOLNet),其中包含一阶逻辑归纳偏差】Learning Language Representations with Logical Inductive Bias
GanLM: Encoder-Decoder Pre-training with an Auxiliary Discriminator
【基于state-space models的预训练语言模型,超过BERT】Pretraining Without Attention
【预训练的时候就考虑人类反馈】Pretraining Language Models with Human Preferences
【Meta的开源LLaMA模型,7B-65B,训练比通常使用的更多的标记的小模型,在各种推理预算下实现最佳性能】LLaMA: Open and Efficient Foundation Language Models
【通过少量示例教大型语言模型自我调试并解释生成代码,但目前已经经常这样用过】Teaching Large Language Models to Self-Debug - 一系列关于大语言模型自我修正能力的论文和工具发布,babyAGI, Auto-GPT - 类似想法:0. 【模型记录并反思自己犯过的错误】 Reflexion: an autonomous agent with dynamic memory and self-reflection - 类似想法:1. 【模型们通过互相交流迭代修正彼此的输出】 DERA: Enhancing Large Language Model Completions with Dialog-Enabled Resolving Agents
How Far Can Camels Go? Exploring the State of Instruction Tuning on Open Resources
LIMA: Less Is More for Alignment
【Tree-of-thought, 越来越像alphago了】Deliberate Problem Solving with Large Language Models
全面的大型语言模型资源集合
该工具未明确声明开源协议,商业使用前请联系原作者确认授权范围,避免侵权风险。
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
AI Skill Hub 点评:语言模型资源 的核心功能完整,质量优秀。对于AI 技术爱好者来说,这是一个值得纳入个人工具库的选择。建议先在非生产环境试用,再逐步推广。
| 原始名称 | Reading_groups |
| Topics | chatgptgpt-3gpt-4large-language-modelsllm |
| GitHub | https://github.com/crazyofapple/Reading_groups |
收录时间:2026-05-28 · 更新时间:2026-05-28 · License:未公布 · AI Skill Hub 不对第三方内容的准确性作法律背书。