t

train-llm-from-scratch

由 FareedKhan-dev 研发

这是一个使用纯 PyTorch 从零手写的 Transformer 语言模型训练框架。它不仅复现了《Attention is All You Need》架构,支持在单卡或多卡上从零预训练百万至十亿参数规模的 LLM;最新版本更完整覆盖了现代大模型后训练流水线,纯手工实现了 SFT、Reward Model、PPO、DPO 及 GRPO 等对齐算法,且不依赖任何高级第三方库。它还提供了一个基于 Streamlit 的 Web 可视化界面供训练和交互。

  • 纯 PyTorch 从零手写实现 Transformer 架构
  • 完整的现代大模型后训练与对齐套件 (SFT/RM/PPO/DPO/GRPO)
  • 支持从 13M 到 Billion 级参数规模
  • 原生支持多卡分布式训练 (DDP + bf16)
  • 内置基于 Streamlit 的全流程可视化控制台
desktopweb