録实録译稿议社区 24h

词术语频次

历封存归档

hybrid attention

█▃▃▂ · 19 次 · 收录于 11 篇

混合多种注意力路径的架构

transformers v5.9.0 工程 · GitHub Release · 05-20
LLM架构最新进展：KV共享、mHC与压缩注意力研究 · Sebastian Raschka · 05-17
TurboQuant 首次全面研究：精度与性能评测 · vLLM · 05-15
TurboQuant 首次全面研究：精度与性能研究 · vLLM · 05-12
服务 DeepSeek-V4：为什么百万 token 上下文是推理系统问题工程 · Together AI · 05-09
Gemma 4 架构近似前代，benchmark 明显提升研究 · X · 05-07
现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
vLLM 中 FP8 KV-Cache 与 Attention 量化的现状工程 · vLLM · 05-03
deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03

更新于五月二十五日 09:40