nanochat
▄█
·
10 次
·
收录于 3 篇
Karpathy开发的快速训练GPT-2能力模型的LLM项目
-
autoresearch 项目发布单 GPU 自包含版,AI agent 自主迭代训练代码优化 LLM
工程 · X · 05-16
-
nanochat 单节点 8XH100 训练 2 小时达 GPT-2 级别能力,数据集切换至 NVIDIA ClimbMix
工程 · X · 05-16
-
autoresearch使nanochat的Time to GPT-2缩短11%
工程 · X · 05-07