OlmoEarth v1.1：更高效的模型系列 | Ai2

OlmoEarth v1.1: A more efficient family of models | Ai2

二〇二六年五月十九日 · 英文原文

摘要

Ai2于2026年5月19日发布OlmoEarth v1.1，该模型系列通过将Sentinel-2影像中多个分辨率的token合并为单个token，将token序列长度缩减至原来的三分之一，从而将计算成本降低多达3倍，同时在与合作伙伴共同构建的研究基准和任务组合上保持v1性能。模型提供Base、Tiny、Nano三种规模，权重与训练代码已在Hugging Face和GitHub开源。

2026年5月19日

Gabriel Tseng - Ai2

我们在2025年11月发布了OlmoEarth (v1)。自那以来，合作伙伴已将其应用于广泛的任务，从追踪红树林变化、分类森林损失驱动因素，到在数天内生成国家级作物类型地图，并将部署规模扩展到国家、大陆乃至全球范围。每一次发布都让我们更接近使命：将最先进的AI带给致力于保护人类和地球的组织与社区。

当OlmoEarth处理卫星影像以在数万至数十万平方公里范围内进行预测时，效率决定了可能性。在运行OlmoEarth的完整生命周期中——数据导出、预处理、推理和后处理——计算成本是迄今为止最高的开销。更高效的模型意味着我们可以在OlmoEarth平台上支持更多合作伙伴，也意味着任何自行运行OlmoEarth的用户都能以更低成本、更快速度利用这项技术。

正因如此，我们构建了OlmoEarth v1.1：一个新的模型系列，可将计算成本降低多达3倍，同时在与合作伙伴共同构建的研究基准和任务组合上保持OlmoEarth v1的性能。

通过缩短序列长度提升效率

OlmoEarth模型基于Transformer架构，这是当今机器学习的主流架构之一。为了处理遥感数据，我们首先将其转换为模型可以理解的_token_序列。

控制Transformer模型效率有两个重要杠杆：模型大小（这也是我们发布模型系列的原因，用户可根据计算预算选择合适的大小）和token序列长度。计算成本与token序列长度呈二次方关系，因此即使是微小的缩减也能显著降低运行模型的成本。

设计token

这引出了基于Transformer的遥感模型的一个重要问题：一个token应该代表什么？

以我们常处理的Sentinel-2影像为例。一个Sentinel-2输入是一个具有高度和宽度（H, W代表纬度和经度像素）、时间维度T以及12个Sentinel-2通道（[H, W, T, D=12]）的张量。

目前，我们将数据拆分为_基于分辨率的图块_。具体来说，我们会选择某个空间图块大小p，并将整个Sentinel-2图像分割成大小为p x p的图块：

对于每个图块，我们为_每个时间步、每个分辨率_创建一个token。因此，一个包含2个时间步的Sentinel-2输入，每个图块会产生6个token（2个时间步 x 3个分辨率：10m、20m和60m）。

总的来说，一个[H, W, T, D=12]的Sentinel-2输入将产生H/p x W/p x T x 3个token。

在处理Sentinel-2数据时，为每个分辨率使用独立的token是一种常见技术——Galileo和SatMAE都采用了这种方法，且SatMAE在这样做时显示出显著更好的结果。然而，这并非普遍做法：CROMA是一个仅对所有波段使用单个token的模型，无论分辨率如何。由于token数量会成倍增加，将多个分辨率合并为一个token可产生三倍更少的token，并在预训练、微调和推理中节省大量资源。

如果简单地将token合并，会导致性能显著下降，包括m-eurosat kNN（遥感模型常用基准任务）下降10个百分点。我们假设，将Sentinel-2波段分离到不同token中，使得OlmoEarth更容易建模重要的跨波段关系。

要在不影响性能的情况下合并token，我们需要修改预训练方案。我们在论文中详细描述了这些改动。

面向开发者

结果是，这个模型系列能以更少资源完成更多工作。在每种规模下，OlmoEarth v1.1的运行成本比OlmoEarth v1低三倍，使得每个运行OlmoEarth的团队都能更经济地实现频繁的全球尺度地图更新。如果你正在使用原始OlmoEarth系列的模型，请尝试OlmoEarth v1.1。它在仅需三分之一计算量的情况下提供与OlmoEarth v1相似的性能，尽管我们观察到一些退化（详情请参阅我们的技术报告）。如果它适用于你的任务，你应该会在微调和推理过程中看到显著的加速。

面向研究者

预训练的遥感模型具有许多自由度，这使得它们难以研究。当性能发生变化时，是架构、数据集还是预训练算法导致的？

我们在与OlmoEarth v1相同的数据集上训练OlmoEarth v1.1，因此两者之间的任何差异都隔离了方法论变化的影响。我们希望这能推动对遥感模型预训练科学原理的理解。

开始使用

查看OlmoEarth v1.1的权重和训练代码，包括Base、Tiny和Nano模型的权重。

订阅以每月接收关于Ai2最新动态的更新。

译自 Allen AI · 官方 · 录于二〇二六年五月十九日