OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct
OpenBMB launches MiniCPM-V 4.6 1.3B Instruct
OpenBMB(清华大学与ModelBest于2022年共同创立)发布MiniCPM-V 4.6 1.3B Instruct,一款1.3B参数的密集视觉语言模型,支持文本、图像和视频输入。该模型在Artificial Analysis Intelligence Index上得分为13,是2B参数以下开放权重模型中最高分,在MMMU-Pro上得分为38%,同样居2B以下模型之首。运行Index仅需540万输出token,比Qwen3.5 0.8B(非推理)少约19倍。模型权重以Apache 2.0许可证发布在Hugging Face上。
OpenBMB(清华大学 / ModelBest 开放权重合作项目)发布 MiniCPM-V 4.6 1.3B Instruct,一款在 Artificial Analysis Intelligence Index 上得分为 13 的微型非推理模型
该模型在 Intelligence Index 上领先 Qwen3.5 0.8B(非推理,10 分)3 分,落后 Qwen3.5 2B(非推理,15 分)2 分,在我们的 Intelligence vs. Total Parameters 图表上建立了一个新的帕累托最优(Pareto-optimal)点。微型模型适用于高效推理和端侧(on-device)应用场景。
MiniCPM-V 4.6 1.3B Instruct 是一个视觉语言模型(vision-language model),支持文本、图像和视频输入,输出文本。OpenBMB 是一个中国实验室,由清华大学 NLP 实验室和 ModelBest Inc. 于 2022 年共同创立。
该模型的权重已在 Hugging Face 上以 Apache 2.0 许可证发布。
关键结果:
➤ 在 1.3B 参数规模下,MiniCPM-V 4.6 1.3B Instruct 在 Artificial Analysis Intelligence Index 上得分为 13,是 2B 参数以下所有开放权重模型中得分最高的。 同等规模下次智能的开放权重模型是 Qwen3.5 0.8B(推理,11 分),其运行 Intelligence Index 所需的 token 数量是前者的 43 倍;Qwen3.5 2B 得分为 16(推理)和 15(非推理),但参数数量是前者的 1.7 倍(2.27B)。MiniCPM-V 4.6 1.3B Instruct 在 MMMU-Pro 上也位居 2B 以下开放权重模型之首,得分为 38%。
➤ MiniCPM-V 4.6 1.3B Instruct 扩展了 Intelligence vs. Total Parameters 的开放权重帕累托前沿(Pareto frontier)。 由于该模型是密集模型(dense model),总参数和活跃参数数量均为 1.3B,因此它同时推进了两个前沿。次智能的 2B 以下模型(Qwen3.5 0.8B(推理),11 分)落后 2 分,尽管它也使用了推理模式。
➤ MiniCPM-V 4.6 1.3B Instruct 具有极高的 token 效率,运行 Intelligence Index 仅使用了 540 万个输出 token,比 Qwen3.5 0.8B(非推理,1.01 亿)少约 19 倍,比 Qwen3.5 0.8B(推理,2.33 亿)少约 43 倍。 这是在 Index 上得分达到 10 或以上的 4B 总参数以下开放权重模型中,测得的输出 token 数量最低的(次低的是 Ministral 3 3B,为 1550 万)。
➤ MiniCPM-V 4.6 1.3B Instruct 支持原生多模态输入,包括文本、图像和视频,在 MMMU-Pro 上得分为 38%。 这是 2B 参数以下所有开放权重模型中测得的最高视觉推理得分,领先于 LFM2.5-VL-1.6B(27%)和 Qwen3.5 0.8B(非推理,26%)。在此参数规模下支持视频输入并不常见。
➤ 知识召回能力较低,与其他 2B 以下模型一致。 AA-Omniscience 得分为 -85,处于 2B 以下非推理模型的典型范围(Qwen3.5 0.8B(非推理)为 -89,Exaone 4.0 1.2B(非推理)为 -83),落后于 Qwen3.5 2B(非推理)的 -83(参数数量是其 1.7 倍)2 分。
其他模型细节:
➤ 规模: 1.3B 总参数(密集模型)
➤ 上下文窗口: 262K
➤ 精度: BF16
➤ 许可证: Apache 2.0
➤ 提供商: 发布时无确认的提供商

MiniCPM-V 4.6 1.3B Instruct 在 2B 以下规模,同时扩展了 Intelligence vs. Total Parameters 和 Intelligence vs. Active Parameters 的开放权重帕累托前沿。

MiniCPM-V 4.6 1.3B Instruct 具有极高的 token 效率, 运行 Artificial Analysis Intelligence Index 仅使用了 540 万个输出 token,这是在 Intelligence Index 上得分达到 10 或以上的 4B 以下开放权重模型中,测得的输出 token 数量最低的。

MiniCPM-V 4.6 1.3B Instruct 在知识召回和幻觉避免方面表现出弱点。 其 AA-Omniscience 得分为 -85,与其他 2B 以下非推理模型处于同一范围(Qwen3.5 0.8B(非推理)为 -89,Exaone 4.0 1.2B(非推理)为 -83)。

Intelligence Index 和 MMMU-Pro 的完整结果:
