train-llm-from-scratch

由 FareedKhan-dev 研发

关于产品

这是一个使用纯 PyTorch 从零手写的 Transformer 语言模型训练框架。它不仅复现了《Attention is All You Need》架构，支持在单卡或多卡上从零预训练百万至十亿参数规模的 LLM；最新版本更完整覆盖了现代大模型后训练流水线，纯手工实现了 SFT、Reward Model、PPO、DPO 及 GRPO 等对齐算法，且不依赖任何高级第三方库。它还提供了一个基于 Streamlit 的 Web 可视化界面供训练和交互。

核心能力

纯 PyTorch 从零手写实现 Transformer 架构
完整的现代大模型后训练与对齐套件 (SFT/RM/PPO/DPO/GRPO)
支持从 13M 到 Billion 级参数规模
原生支持多卡分布式训练 (DDP + bf16)
内置基于 Streamlit 的全流程可视化控制台

支持平台

desktopweb

资源链接

GitHub 仓库 ↗