GitHub · 版本发布

vllm v0.19.1

vllm v0.19.1

二〇二六年六月六日 · 英文原文

v0.19.0补丁版本,主要升级Transformers至v5.5.3并修复Gemma4多项问题:修复流式工具调用中JSON无效、HTML重复、布尔值/数值拆分损坏及null转换错误;修复LoRA适配器加载与token重复问题;新增量化MoE与Eagle3支持;调整request为推理解析器;修复kimi_k25中media_placeholder_token_id解析。

这是 v0.19.0 之上的一个补丁版本,包含 Transformers v5.5.3 升级和 Gemma4 的 bug 修复:

译自 GitHub · 版本发布 · 录于 二〇二六年六月六日