实録译稿 社区 24h

术语频次

封存归档

distillation

▂▂█▃ · 135 次 · 收录于 40 篇

知识蒸馏 · 大模型教小模型

  1. BitCPM-CANN-1B 工程 · OpenBMB · 05-24
  2. BitCPM-CANN-3B 工程 · OpenBMB · 05-24
  3. BitCPM-CANN-8B 研究 · OpenBMB · 05-24
  4. BitCPM-CANN-0.5B 工程 · OpenBMB · 05-24
  5. BitCPM-CANN-1B-gguf 研究 · OpenBMB · 05-24
  6. BitCPM-CANN-0.5B-gguf 研究 · OpenBMB · 05-24
  7. BitCPM-CANN-3B-gguf 研究 · OpenBMB · 05-24
  8. BitCPM-CANN-8B-gguf 研究 · OpenBMB · 05-24
  9. BitCPM4-CANN-0.5B-gguf 研究 · OpenBMB · 05-22
  10. BitCPM4-CANN-1B-gguf 研究 · OpenBMB · 05-22
  11. BitCPM4-CANN-3B-gguf 研究 · OpenBMB · 05-22
  12. BitCPM4-CANN-8B-gguf 研究 · OpenBMB · 05-22
  13. 推出 Ettin Reranker 系列 产品 · HF Blog · 05-19
  14. LongLive-2.0:面向长视频生成的NVFP4并行基础设施 研究 · HF Papers · 05-19
  15. BitCPM4-CANN-0.5B 工程 · OpenBMB · 05-18
  16. BitCPM4-CANN-1B 工程 · OpenBMB · 05-18
  17. BitCPM4-CANN-3B 工程 · OpenBMB · 05-18
  18. BitCPM4-CANN-8B 研究 · OpenBMB · 05-18
  19. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  20. Causal Forcing++:面向实时交互视频生成的可扩展少步自回归扩散蒸馏 研究 · HF Papers · 05-16
  21. 2028:全球AI领导力的两种情景 研究 · Anthropic Research · 05-15
  22. Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量 产品 · HF Blog · 05-15
  23. AnyFlow: 基于同策略流图蒸馏的任意步视频扩散模型 研究 · HF Papers · 05-14
  24. 分享通过 OpenRouter 和 Ollama 从开放权重模型生成蒸馏数据的实用工具 工程 · X · 05-13
  25. Codex 通过分层 prompt 结构最大化缓存命中率以降低长上下文编码 agent 成本 工程 · X · 05-13
  26. 解读今日开放-封闭性能差距 研究 · Interconnects · 05-12
  27. 蒸馏恐慌 对话 · Interconnects · 05-12
  28. 我对开源模型的押注,2026年中 研究 · Interconnects · 05-12
  29. 讨论 multi-teacher distillation 合并领域专家的效率优势 研究 · X · 05-10
  30. LLM 蒸馏 Ch08 Notebook 在 GitHub 发布 工程 · X · 05-07
  31. 综述梳理 MOPD 在近期 LLM 后训练中的应用 研究 · X · 05-07
  32. D-OPSD:用于持续调优步蒸馏扩散模型的 On-Policy 自蒸馏 研究 · HF Papers · 05-07
  33. Stream-R1:面向流式视频生成的可靠性-困惑度感知奖励蒸馏 研究 · HF Papers · 05-07
  34. 面向医疗 agent 的 Healthcare AI GYM HF Papers · 05-06
  35. 从树到流再回到树:统一 Decision Trees 与 Diffusion Models HF Papers · 05-04
  36. Coding Agent 的组成部分 Sebastian Raschka · 05-03
  37. 用于视觉生成的表征 Fréchet Loss HF Papers · 05-01
  38. 协同演化的策略蒸馏 HF Papers · 05-01
  39. 新时代的视觉生成:从原子映射到 Agentic 世界建模的演进 HF Papers · 05-01
  40. 扭转 TIDE:Diffusion 大语言模型的跨架构蒸馏 HF Papers · 04-30