一声棒喝,本不立文字
偏要著録,已是二义

X · 研究者一手

@_philschmid 让 Gemma 跑得飞快!!! Multi-Token Prediction drafters 来了 fo…

@_philschmid Make Gemma go brrrr!!! Multi-Token Prediction drafters are here fo…

二〇二六年五月八日 · 英文原文

Multi-Token Prediction drafters 已适配 Gemma 4,在零输出质量退化情况下使 inference 速度最高提升 3x,支持 E2B 和 E4B 版本,模型以 Apache 2.0 license 发布,并提供 blog 与 models 链接。

让 Gemma 跑起来!!!Multi-Token Prediction drafters 已适配 Gemma 4,在零质量损失的情况下让 inference 最快提升 3x。⚡️

blog: https://t.co/RKSp8AqnAp models: https://t.co/XWOxQRYPtn

译自 X · 研究者一手 · 录于 二〇二六年五月八日