一声棒喝,本不立文字
偏要著録,已是二义

Hugging Face · Daily Papers

视觉-语言模型中抑制幻觉的在线自校准

Online Self-Calibration Against Hallucination in Vision-Language Models

Minghui Chen, Chenxu Yang, Hengjie Zhu, Dayan Wu, Zheng Lin, Qingyi Si
二〇二六年五月四日 · arXiv:2605.00323 · PDF

大型 Vision-Language Models(LVLMs)常受 hallucination(幻觉)问题影响,生成的描述会包含输入图像中不存在的视觉细节。近期的 preference alignment 方法通常依赖从 GPT 等更强模型蒸馏得到的监督信号。然而,这种离线范式会引入 Supervision-Perception Mismatch:student model 被迫对齐超出其感知能力的细粒度细节,从而学会猜测而不是看见。

为获得可用于在线学习的可靠 self-supervision,我们发现 LVLMs 内部存在 Generative-Discriminative Gap,即模型在判别式验证上的准确率高于开放式生成。利用这一能力,我们提出 Online Self-CAlibRation(OSCAR),这是一个将 Monte Carlo Tree Search 与 Dual-Granularity Reward Mechanism 相结合的框架,用于构建 preference data,并通过 Direct Preference Optimization 迭代优化模型。

大量实验表明,OSCAR 在 hallucination benchmark 上达到 SOTA 性能,同时提升了通用多模态能力。

译自 Hugging Face · Daily Papers · arXiv:2605.00323 · 录于 二〇二六年五月四日