X · 研究者一手
@_philschmid 让 Gemma 跑得飞快!!! Multi-Token Prediction drafters 来了 fo…
@_philschmid Make Gemma go brrrr!!! Multi-Token Prediction drafters are here fo…
摘要
Multi-Token Prediction drafters 已适配 Gemma 4,在零输出质量退化情况下使 inference 速度最高提升 3x,支持 E2B 和 E4B 版本,模型以 Apache 2.0 license 发布,并提供 blog 与 models 链接。
让 Gemma 跑起来!!!Multi-Token Prediction drafters 已适配 Gemma 4,在零质量损失的情况下让 inference 最快提升 3x。⚡️
- inference 速度最快提升 3x
- 输出零退化
- 支持 E2B 和 E4B 版本
- Apache 2.0 license https://t.co/ggYSpyNrTZ
blog: https://t.co/RKSp8AqnAp models: https://t.co/XWOxQRYPtn
译自 X · 研究者一手 · 录于 二〇二六年五月八日