实録译稿 社区 24h

术语频次

封存归档

self-play

· 4 次 · 收录于 2 篇

自我对弈 · 模型与自身博弈生成训练数据

  1. wanshuiyin/睡眠中自动 Claude Code 研究 工程 · GitHub · 05-08
  2. 从上下文到技能:语言模型能否熟练地从上下文中学习 HF Papers · 05-05