气象数据

ERA5-Drought 全球干旱指数数据集解读 — ECMWF 官方综述

· 南京运梦科技算法团队 · 评审 算法负责人

ERA5-Drought 全球干旱指数数据集解读 — ECMWF 官方综述 封面

ERA5 把过去 80 余年的全球天气重建成了逐小时、无死角的"数字底座",但它本质上只回答一个问题:天上下了多少雨、地表蒸发了多少水?真正决定农业减产、电网负荷异常、来水偏枯的,是"水到底够不够"这种累积性的旱情判断。2025 年发表在 Nature 旗下《Scientific Data》上的 ERA5-Drought 数据集,正是 ECMWF 官方团队把 ERA5 这条原始气象流,标准化成了一套可以直接拿来评估全球干旱的指数产品。对任何要把历史气象数据接进风电、光伏、来水与负荷模型的从业者来说,这是一篇值得逐条拆开看的"上游真相源"论文。

全球干旱数据图

关键要点

  • ERA5-Drought 是 ECMWF 官方团队基于 ERA5 构建的全球干旱指数数据集,2025 年发表于 Nature 旗下《Scientific Data》。
  • 数据规格:基于 ERA5、覆盖 1940 年至今、0.25° 全球网格,与 ERA5 主数据同源同口径。
  • 指标体系:同时提供 SPI(仅降水)与 SPEI(纳入蒸散需求、对升温更敏感),并给出 1 个月到 4 年的多种累积尺度。
  • 不确定性:每个指标同时提供确定性版本与 10 成员集合概率版本,可量化旱情判断本身的不确定性。
  • 落地:运梦气象 API 提供 ERA5 原始气象要素(非转售该数据集),可据此自行复算 SPI / SPEI 等干旱输入,接入风电、光伏、来水与负荷模型。

背景与权威性

这篇论文的全称是 ERA5-Drought: Global drought indices based on ECMWF reanalysis,作者为 Keune、Di Giuseppe 等人,出品方是 ECMWF(欧洲中期天气预报中心),2025 年发表于 Nature 旗下的 Scientific Data

为什么说它权威,可以从三个层面看。其一是期刊层级:《Scientific Data》是 Nature 旗下专门发表数据集(Data Descriptor)的期刊,对数据的可复现性、元数据完整性、获取方式有严格的同行评审要求,能在这里发表,意味着数据本身被当作一份可被独立检验的科研产出,而不只是附带的副产品。其二是出品方:这套指数直接由 ERA5 的"娘家"ECMWF 团队构建,与 ERA5 再分析主数据同源、同口径,避免了第三方在二次加工中引入的口径漂移。其三是它的角色:它被定位为 ERA5 干旱应用的官方数据源——当下游研究、监测平台或商业产品需要一套"标准答案"式的全球干旱指标时,引用这套数据是自然而然的选择。

引用量方面,截至 2026 年 5 月,Semantic Scholar 记录的引用为 31 次(核实于 2026 年 5 月)。对一篇 2025 年才发表、问世不到两年的数据论文而言,这个引用速度说明它正快速成为该主题的参考基准文献。

它做了什么

这篇数据论文的核心工作,是把 ERA5 这条连续、一致的全球再分析数据流,转化为一套标准化、可直接消费的干旱指数数据集。

从数据规格看,它基于 ERA5 构建了从 1940 年至今、0.25° 空间分辨率的全球干旱指数数据集。这个时空底盘和 ERA5 主数据保持一致——既覆盖了足够长的历史以刻画多年尺度的旱涝周期,又保持了全球无缝的网格覆盖。

在指标体系上,数据集同时包含两类被广泛使用的标准干旱指标:

  • SPI(标准化降水指数):只看降水的盈亏,刻画"水从天上来"的部分;
  • SPEI(标准化降水蒸散指数):在降水之外纳入大气蒸散需求,刻画"水又被蒸发走"的部分,因此对升温背景下的干旱信号更敏感。

两类指标都提供了从 1 个月到 4 年的多种累积尺度。这一点对应用至关重要:短累积尺度(如 1 至 3 个月)反映农业土壤水分这类"快变量"的旱情,长累积尺度(如 12 至 48 个月)则反映水库蓄水、地下水、河川径流这类"慢变量"的长期亏缺。同一套数据能横跨这两端,意味着农业、水文、供水可以共用一个口径。

不确定性表达方面,论文的一个突出设计是:每个指标都同时提供确定性版本与 10 成员集合(ensemble)的概率版本。确定性版本给出单一估计,便于直接使用;10 成员集合版本则用一组扰动样本表达"这个干旱判断本身有多确定",让下游能够量化旱情评估的不确定性,而不是把一个点估计当成无误差的真值。

关键结论

把核实过的要点收敛成几条可直接引用的结论:

  • 这是一套基于 ERA5、覆盖 1940 年至今、0.25° 分辨率的全球干旱指数数据集,时空底盘与 ERA5 主数据一致。
  • 它同时提供 SPI 与 SPEI 两类标准干旱指标,并覆盖从 1 个月到 4 年的多种累积尺度,可同时服务快变(农业)与慢变(水文、供水)两类旱情判断。
  • 每个指标都配有确定性版本与 10 成员集合的概率版本,使干旱评估的不确定性可以被定量表达——这是它区别于许多只给单一估计的干旱产品的设计特征。
  • 它由 ECMWF 官方出品、发表在 Nature 旗下《Scientific Data》,定位为 ERA5 干旱应用的官方数据源,直接服务于水资源管理、农业与粮食安全监测。

需要强调的是:上述均为论文已核实的定性与结构性结论;具体的偏差量级、与站点的对比误差等数值,应以原文与官方数据文档为准,本文不做臆测。

对新能源与运梦平台的意义

干旱指数听起来离风电、光伏很远,实则不然。对新能源资源评估与功率预测而言,这篇论文的价值大致体现在三条链路上。

其一,长期气候背景的甄别。风、光资源评估最怕的就是把一段异常年份当作典型年。ERA5-Drought 提供的多尺度 SPI / SPEI,可以作为标记历史时段"干 / 湿背景"的标尺:当你用 ERA5 历史风速、辐射数据做选址或电量评估时,先用干旱指数判断所选年份处在多年序列的哪个位置,有助于更稳健地构造典型气象年(TMY),避免资源评估被极端年份带偏。

其二,水与能耦合及场景关联。干旱与极端高温、持续晴空往往同期出现:持续干旱少雨的时段,常对应高辐照、高温的天气型,这既影响光伏的辐照可得性与组件温度衰减,也通过制冷需求影响电网负荷曲线;而对水电占比高的区域,长累积尺度的旱情更是来水与调度的先行信号。把干旱指数作为一个外生特征接进负荷或来水模型,是值得探索的方向。

其三,不确定性意识的迁移。这篇论文用集合方法量化干旱评估不确定性的思路,对新能源功率预测同样有借鉴意义——资源评估和功率预测的结论,本就应该带着置信区间交付,而不是一个孤零零的点值。

需要客观说明的是:ERA5-Drought 是干旱专题数据集,运梦气象 API 当前对外提供的是 ERA5 与德国气象局的原始气象要素;下面给出的是如何用这些原始要素自行复算干旱相关输入的思路,而非直接转售该论文数据集。

在运梦气象 API 上手

干旱指数的两个基本输入——降水与潜在蒸散——都可以由运梦气象 API 的 ERA5 原始气象要素复算得到。SPI 只需要降水;SPEI 需要在降水之外,用气温、湿度、气压、辐射、风速等要素估算潜在蒸散(如 Penman-Monteith 或 Thornthwaite 方法)。

对应到字段上:

  • 降水:pr(累积降水量);
  • 蒸散输入:tas(2m 气温)、hurs(2m 相对湿度)、sp(地面气压)、辐射项 rsds(地面入射短波辐射)、风速项 ws(或 u100 / v100 等风分量)。

这些字段通过 downloadSync 接口按 dataSourceIdfields 拉取,dataSourceIdera5 即可获得与本文论文同源的 ERA5 历史序列。一个用于复算 SPEI 月度输入的最小请求体示意如下:

{
  "dataSourceId": "era5",
  "lat": 31.5,
  "lon": 118.5,
  "stime": "1991-01-01 00:00",
  "etime": "2020-12-31 23:00",
  "fields": ["pr", "tas", "hurs", "sp", "rsds", "ws"],
  "timezone": "8"
}

拿到这段长序列后,按月聚合降水与蒸散、再做标准化,即可在本地复现 SPI / SPEI 的多累积尺度计算逻辑;若只关心风、光资源本身,则把字段换成 u100 / v100 / ws / wd(风资源)或 rsds / dni / dhi(光伏)即可。

延伸阅读与上手入口:

常见问题

ERA5-Drought 数据集是谁做的、发表在哪里?

它由 ERA5 的"娘家"ECMWF(欧洲中期天气预报中心)官方团队构建,作者为 Keune、Di Giuseppe 等人,2025 年发表在 Nature 旗下专门发表数据集的《Scientific Data》上,被定位为 ERA5 干旱应用的官方数据源。

ERA5-Drought 包含哪些干旱指标?时间和分辨率范围是多少?

它基于 ERA5 构建,覆盖 1940 年至今、0.25° 空间分辨率,同时提供 SPI(标准化降水指数)与 SPEI(标准化降水蒸散指数)两类标准指标,并覆盖从 1 个月到 4 年的多种累积尺度。

SPI 和 SPEI 有什么区别?

SPI 只看降水盈亏,刻画"水从天上来"的部分;SPEI 在降水之外纳入大气蒸散需求,刻画"水又被蒸发走"的部分,因此对升温背景下的干旱信号更敏感。

ERA5-Drought 和普通干旱产品相比有什么特别之处?

它的每个指标都同时提供确定性版本与 10 成员集合的概率版本,使干旱评估的不确定性可以被定量表达,而不是把一个点估计当成无误差的真值——这是它区别于许多只给单一估计的干旱产品的设计特征。

能直接从运梦气象 API 拿到这套干旱指数吗?

不能直接转售该数据集。运梦气象 API 当前对外提供的是 ERA5 与德国气象局的原始气象要素;你可以通过 downloadSync 接口、用 dataSourceIdera5 拉取降水 pr 与蒸散输入(tashurssprsdsws 等)原始要素,在本地自行复算 SPI / SPEI。

引用与原文

Keune, J., Di Giuseppe, F., et al. ERA5-Drought: Global drought indices based on ECMWF reanalysis. Scientific Data (2025).

原文链接:doi.org/10.1038/s41597-025-04896-y