Andrej Karpathy开源AI自动调优工具autoresearch

3月8日,Eureka Labs创始人、OpenAI联合创始人Andrej Karpathy正式发布其最新开源项目autoresearch,将此前在LLM训练项目nanochat中实现的AI Agent自动调优工作流独立封装,供全球开发者使用。该项目以“人写Markdown,AI写代码”为核心设计思路,允许开发者通过编写program.md文件明确研究目标,由AI Agent自主生成并迭代优化包含完整GPT模型结构、Muon+AdamW优化器及训练循环逻辑的train.py代码(约630行)。 每次实验固定运行5分钟,以验证集每字节比特数(val_bpb)作为唯一评估指标。若改进结果优于基线,则保留并提交;否则丢弃。该流程每小时可完成约12次实验,一夜间可实现近100次自动化测试。根据展示案例,在83次实验中成功产出15次有效优化,验证了系统的高效性与稳定性。 项目仅需一块NVIDIA GPU即可运行,已在H100上完成测试,依赖PyTorch及少量轻量级软件包,采用MIT协议开源。目前社区已出现针对macOS系统及MLX框架的适配分支,展现出良好的扩展潜力和生态响应能力。