气象数据

ERA5-Land 论文解读 — 陆面再分析金标准与新能源数据底座综述

· 南京运梦科技算法团队 · 评审 算法负责人

ERA5-Land 论文解读 — 陆面再分析金标准与新能源数据底座综述 封面

如果你做风电选址、光伏资源评估,或者训练任何依赖历史气象场的模型,那么 ERA5 与它的陆面增强版 ERA5-Land,几乎是你绕不开的数据底座。2021 年,ECMWF(哥白尼气候变化服务 C3S)的 Muñoz-Sabater、Dutra、Agustí-Panareda 等人在《Earth System Science Data》(ESSD)发表了 ERA5-Land: a state-of-the-art global reanalysis dataset for land applications 这篇数据描述论文,系统交代了 ERA5-Land 的生产方法、规格与对比评估。截至 2026 年 5 月核对,这篇论文的引用量已在约 3,700–3,800 次区间(Crossref 约 3,714、Semantic Scholar 约 3,829),是陆面、光伏、水文领域引用 ERA5-Land 时的默认出处。本文从工程实践视角,帮你把这篇论文读薄、用厚。

关键要点

  • ERA5-Land 是对 ERA5 大气强迫做无耦合(uncoupled)陆面重跑的产物,专为陆地应用提升精度,而非重做整套大气同化。
  • 核心规格:空间分辨率约 9km(0.1°)、逐小时输出、时间覆盖从 1950 年至今,构成长达数十年的连续陆面序列。
  • 在土壤湿度、积雪、径流、蒸散等陆面要素上,ERA5-Land 较 ERA5 更精细、与站点观测吻合更好;但高空大气、海洋等非陆面变量仍以 ERA5 为准,二者互补而非替代。
  • 论文发表于 ESSD 顶刊、由 ECMWF / C3S 团队亲撰、被引达数千次(截至 2026 年,ESSD 官方 metrics 页 Crossref 记录约 3,400 余次),是陆面/光伏/水文领域引用 ERA5-Land 的标准出处。
  • 新能源实务常见做法:陆面要素看 ERA5-Land、风与辐射强迫看 ERA5,配合使用作为风光资源评估与功率预测训练的历史底座。

背景与权威性

先说清楚这篇文章值不值得读。

ERA5-Land 论文发表在 ESSD(Earth System Science Data),这是地球系统科学领域专门刊登数据集描述的高影响因子期刊。它的特别之处在于:ESSD 不只评审文字,还对论文背后的数据集本身做严格评审——数据可获取性、生产流程、质量评估都要经得起复核。换句话说,能在 ESSD 上立此存照的数据集,等于经过了同行对数据本体的把关,这也是它影响因子长期较高的原因之一。

第二个权威性来源是作者。论文由 ECMWF / C3S 团队亲自撰写。ERA5-Land 本身就是 ECMWF 的产品,由出品方下场写方法学论文,意味着这是关于数据生产细节第一手、最准确的描述,而非第三方转述。

第三是引用量。数千次量级的引用规模(截至 2026 年,ESSD 官方 metrics 页 Crossref 记录约 3,400 余次),使它在数年内成为陆面再分析方向被反复援引的经典文献。无论是写论文、做技术方案,还是向客户解释我们的历史气象数据从哪来,引用这篇 ESSD 论文都是稳妥且专业的做法。

综合来看,期刊层级(数据描述类顶刊)、作者身份(出品方亲撰)、引用规模(数千次)三者叠加,使这篇论文在陆面、光伏、水文领域具备标准出处的地位。

它做了什么

论文的核心工作,可以用一句话概括:对 ERA5 的大气强迫做一次无耦合(uncoupled)的陆面重跑,专门为陆地应用提升精度。

要理解这件事,先回忆 ERA5 是什么。ERA5 是 ECMWF 的第五代全球再分析数据集,通过数据同化把多源观测融合进数值模式,得到物理一致、时空连续的历史气象场,覆盖范围广、逐小时输出。但 ERA5 的网格分辨率对很多陆面应用(流域、土壤、积雪)来说仍偏粗。

ERA5-Land 的做法是:保留 ERA5 经过同化的大气状态作为驱动(强迫)数据,把它输入陆面模式,单独再跑一遍陆面过程。这里的无耦合很关键——陆面过程不再反过来影响大气,而是被动地接受 ERA5 的大气强迫。这样做的好处是,可以在不重做整套昂贵的大气同化的前提下,把陆面要素的空间分辨率显著提高。

规格:约 9km、逐小时、回溯到 1950 年

论文给出的核心规格包括:

  • 空间分辨率提升至约 9km(0.1°),相比 ERA5 的原生网格更精细,更贴近真实地形与下垫面差异;
  • 时间分辨率为逐小时,可以刻画日内变化;
  • 时间覆盖从 1950 年延续至今,构成长达数十年的连续陆面序列。

验证方式:与站点观测对比

论文不只交代怎么生产,还给出了质量如何。作者把 ERA5-Land 与 ERA5 以及独立的站点观测做对比评估,重点考察土壤湿度、积雪、径流、蒸散等陆面要素。这种生产方法 + 对比评估双线并行的写法,正是 ESSD 数据描述论文的标准范式,也让读者能据此判断在自己的场景里能信到什么程度。

关键结论

抓住论文里这几条经过核实的结论即可:

  • ERA5-Land 通过无耦合陆面重跑,把陆面要素的空间分辨率提升到约 9km(0.1°),并提供 1950 年至今的逐小时连续序列,在时空精细度上较 ERA5 更进一步。
  • 在土壤湿度、积雪、径流、蒸散等陆面要素上,ERA5-Land 较 ERA5 更精细,且与站点观测的吻合度更好。 这是它为陆地应用而生的直接体现。
  • 论文同时给出了完整的生产方法与对比评估,使数据集的可信度可被独立复核;官方数据集 DOI 为 10.24381/cds.e2161bac,与论文 DOI 相互独立、各司其职。

需要强调一个定性边界:ERA5-Land 的提升集中在陆面要素。对于高空大气、海洋等非陆面变量,它并不替代 ERA5;二者是互补关系,而非替代关系。论文标题中 state-of-the-art(当前技术水平)属于原文用语,本文仅作标题引用,不作为对任何产品的绝对化背书。

对新能源 / 运梦平台的意义

把论文结论映射到新能源工程,价值集中在三个环节。

一、资源评估更贴合地形。 风电与光伏选址高度依赖下垫面与局地地形。ERA5-Land 约 9km 的网格相比 ERA5 更精细,对复杂地形(山地、丘陵、河谷)区域的陆面状态刻画更细,可作为风光资源长期评估时的一类参考底图。需要注意的是,风速、辐射等大气侧变量的同化精度仍由 ERA5 决定,因此实务上常见做法是陆面要素看 ERA5-Land、风与辐射强迫看 ERA5,二者配合使用

二、功率预测训练的历史样本。 数据驱动的功率预测模型需要长序列、时空一致的历史样本。ERA5-Land 从 1950 年至今的逐小时序列,配合 ERA5 的大气场,可为风电、光伏功率预测的特征工程与回测提供长期一致的训练底座。具体落地可参考风电功率预测光伏功率预测的产品思路。

三、历史气象数据的可解释来源。 当客户问你们的历史数据可信吗,能指向一篇 ESSD 顶刊、由 ECMWF 亲撰、被引数千次的论文,本身就是有力的可信度说明。对接光伏解决方案风电解决方案时,这种数据有据可查的属性,往往比单纯的指标罗列更能建立信任。

在运梦气象 API 上手

南京运梦科技的运梦气象 API 采用双数据源设计:历史再分析侧以 ERA5 为底座,预报侧以 德国气象局 为主。数据统一通过 downloadSync 接口按 dataSourceIdfields 拉取,字段沿用 CF 命名,省去在不同工具栈之间反复换名的麻烦。

字段按场景选取:

  • 风资源u100 / v100(100m 经向、纬向风),以及派生的 ws / wd(风速、风向);
  • 光伏rsds(地面入射短波辐射)、dni(直接法向辐照)、dhi(散射水平辐照);
  • 常规气象tas(2m 气温)、hurs(2m 相对湿度)、sp(地面气压)、pr(降水)。

一个最简的 downloadSync 拉取思路如下(以 ERA5 历史场为例):

import os, requests

API = "https://console.yun-meng.top/api/energy-weather/search/weather/action/downloadSync"
payload = {
    "dataSourceId": "era5",                 # 历史再分析底座
    "lat": 31.5, "lon": 118.5,              # 单点经纬度(WGS84)
    "stime": "2024-01-01 00:00",
    "etime": "2024-12-31 23:00",
    "fields": ["u100", "v100", "rsds", "tas"],  # 风+光伏+常规气象按需组合
    "timezone": "8",
}
resp = requests.post(API,
    headers={"Authorization": f"Bearer {os.environ['YUNMENG_TOKEN']}"},
    json=payload, timeout=600)
resp.raise_for_status()
result = resp.json()
if not result.get("success"):
    raise RuntimeError(result.get("msg", "查询失败"))

data = result["data"]
print(len(data["timeList"]), data["u100"][0], data["rsds"][0])

想进一步了解数据源规格与字段口径,可查阅 ERA5 产品页德国气象局预报API 参考数据要素解释。若你想先把 ERA5 的来龙去脉读顺,再看本篇陆面增强版,建议从 ERA5 完全解读入手。

常见问题

ERA5-Land 和 ERA5 有什么区别? ERA5 是 ECMWF 第五代全球再分析数据集,通过数据同化融合多源观测得到物理一致的历史气象场。ERA5-Land 则保留 ERA5 经同化的大气状态作为驱动,单独把陆面过程再跑一遍(无耦合重跑),从而在不重做大气同化的前提下把陆面要素的空间分辨率提升到约 9km。

ERA5-Land 的分辨率和时间覆盖是多少? 空间分辨率约 9km(0.1°),时间分辨率为逐小时,时间覆盖从 1950 年延续至今,构成长达数十年的连续陆面序列。

ERA5-Land 能完全替代 ERA5 吗? 不能。ERA5-Land 的提升集中在土壤湿度、积雪、径流、蒸散等陆面要素;对于高空大气、海洋等非陆面变量,它并不替代 ERA5。二者是互补关系,实务上常见做法是陆面要素看 ERA5-Land、风与辐射强迫看 ERA5,二者配合使用。

ERA5-Land 适合做风电光伏资源评估和功率预测吗? 适合作为参考底座。约 9km 网格对复杂地形(山地、丘陵、河谷)的陆面状态刻画更细,可作风光资源长期评估的参考底图;1950 年至今的逐小时序列配合 ERA5 大气场,可为功率预测的特征工程与回测提供长期一致的训练样本。

引用 ERA5-Land 应该用哪个出处?DOI 是多少? 论文出处为 Muñoz-Sabater 等(2021)发表于《Earth System Science Data》,原文 DOI 为 10.5194/essd-13-4349-2021;官方数据集 DOI 为 10.24381/cds.e2161bac,两者相互独立、各司其职。

引用与原文

Muñoz-Sabater, J., Dutra, E., Agustí-Panareda, A., et al. (2021). ERA5-Land: a state-of-the-art global reanalysis dataset for land applications. Earth System Science Data, 13, 4349.

原文 DOI:doi.org/10.5194/essd-13-4349-2021

官方数据集 DOI:10.24381/cds.e2161bac