实録译稿 社区 24h

术语频次

封存归档

synthetic data

█▆▅▂ · 19 次 · 收录于 14 篇

合成数据 · 由模型生成的训练数据

  1. MagenticLite、MagenticBrain、Fara1.5:为小模型优化的智能体体验 研究 · MS Research · 05-22
  2. 增强AI韧性 研究 · UK AISI · 05-16
  3. Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量 产品 · HF Blog · 05-15
  4. 蒸馏恐慌 对话 · Interconnects · 05-12
  5. OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架 研究 · HF Blog · 05-10
  6. AlphaEvolve:我们的 Gemini 驱动 coding agent 如何在各领域扩大影响 研究 · DeepMind · 05-08
  7. 提出用 LLM 编译研究资料为 Obsidian 知识库 工程 · X · 05-07
  8. NVIDIA 机器人实验室发布 GR00T、Dreams、SONIC 等成果 产品 · X · 05-07
  9. 面向表格基础模型的先验对齐数据清洗 HF Papers · 05-06
  10. NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
  11. 数据科学家的复仇 Hamel Husain · 05-03
  12. 用于长时程生产力模拟的大规模合成计算机 HF Papers · 05-01
  13. 新时代的视觉生成:从原子映射到 Agentic 世界建模的演进 HF Papers · 05-01
  14. Claude Code auto 模式:更安全地跳过权限确认 Anthropic Engineering · 05-01