实録译稿 社区 24h

术语频次

封存归档

nanochat

▄█ · 10 次 · 收录于 3 篇

Karpathy开发的快速训练GPT-2能力模型的LLM项目

  1. autoresearch 项目发布单 GPU 自包含版,AI agent 自主迭代训练代码优化 LLM 工程 · X · 05-16
  2. nanochat 单节点 8XH100 训练 2 小时达 GPT-2 级别能力,数据集切换至 NVIDIA ClimbMix 工程 · X · 05-16
  3. autoresearch使nanochat的Time to GPT-2缩短11% 工程 · X · 05-07