实録译稿 社区 24h

术语频次

封存归档

hybrid attention

█▃▃▂ · 19 次 · 收录于 11 篇

混合多种注意力路径的架构

  1. transformers v5.9.0 工程 · GitHub Release · 05-20
  2. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  3. TurboQuant 首次全面研究:精度与性能 评测 · vLLM · 05-15
  4. TurboQuant 首次全面研究:精度与性能 研究 · vLLM · 05-12
  5. 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题 工程 · Together AI · 05-09
  6. Gemma 4 架构近似前代,benchmark 明显提升 研究 · X · 05-07
  7. 现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
  8. vLLM 中 FP8 KV-Cache 与 Attention 量化的现状 工程 · vLLM · 05-03
  9. deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
  10. deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
  11. DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03