録实録译稿议社区 24h

词术语频次

历封存归档

prefix caching

▄█▂ · 12 次 · 收录于 4 篇

前缀缓存 · 复用相同前缀的 KV cache

sglang v0.5.11 工程 · GitHub Release · 05-12
服务 DeepSeek-V4：为什么百万 token 上下文是推理系统问题工程 · Together AI · 05-09
vLLM V0 到 V1：RL 中纠错前先确保正确性工程 · HF Blog · 05-07
vLLM 中的 DeepSeek V4：高效长上下文 Attention vLLM · 05-03

更新于五月二十五日 09:40