autoresearch
by karpathy
介绍
autoresearch 是 karpathy 推出的一款前沿 AI 智能体研究工具,旨在实现大型语言模型 (LLM) 训练过程的自动化探索与优化。它赋予 AI 智能体修改模型架构、超参数及训练逻辑(`train.py`)的能力,并在固定5分钟内执行训练、评估,以 `val_bpb` 为核心指标进行自主迭代。该系统通过人类编程 `program.md` 文件来指导智能体,致力于在单GPU环境下,自动发现并优化LLM模型配置,显著加速研究进程,实现夜间无人值守的实验突破。
支持平台
linuxmacos