气象数据

ERA5 与站点观测的偏差特征:用前必看的验证

· 南京运梦科技算法团队 · 评审 算法负责人

ERA5 与站点观测的偏差特征:用前必看的验证 封面

很多团队第一次把 ERA5 接进风电、光伏或功率预测流水线时,都会默认它"足够准、直接能用"。这是一个代价很高的误会。ERA5 是当今最权威的全球再分析底座之一,但它本质上是一套以约 31 km 网格、按物理模式同化海量观测得到的格点产品,而不是你机位、组件、测风塔所在那个具体点上的真值。它和站点观测之间存在可量化、且随要素与地形系统变化的偏差。把这些偏差搞清楚,是把 ERA5 用对的前提——对风资源评估、辐照资源分析、功率预测训练样本构建尤其关键。本文汇总三项被反复引用的验证工作,把"用前必看"的偏差特征讲透。

关键要点

  • ERA5 是约 31 km 网格的全球再分析格点产品,不是机位、组件、测风塔所在点的真值,用前必须做站点级偏差订正。
  • 风电侧:Olauson 2018 报告 ERA5 在小时级风电出力建模的平均误差与长期订正不确定性,平均比 MERRA-2 低约 20%。
  • 辐照侧:Urraca 2018 测得 ERA5 GHI 全球平均正偏差约 +4.05 W/m²(欧洲约 +4.54 W/m²),比 ERA-Interim、MERRA-2 平均偏差降低约 50%–75%,约 80% 站点高估,沿海与山区退化。
  • 气温侧:Zhao 与 He 2022 在祁连山区得到 ERA5-Land 月偏差平均约 −1.3°C、RMSE 约 2.2°C,偏差主要由格点高程与站点海拔之差驱动,可用直减率订正。
  • 共性规律:平地准、复杂地形与近海退化;工程纪律是先做站点偏差订正再用,而非默认 ERA5 直接可用。

背景与定位

ERA5 的偏差不是一篇论文能说尽的,因为风速、辐照、气温三类要素的误差结构差异很大。所以本文锚定三项各有代表性的独立验证:

  • 风速 / 风电:Jon Olauson 的《ERA5: The new champion of wind power modelling?》,2018 年发表于 Elsevier 的 Renewable Energy(卷 126,322–331 页)。这是 ERA5 发布后最早系统比较其与 MERRA-2 风电建模能力的工作之一,被后续大量风资源验证研究当作对照基准。
  • 辐照 / 光伏:Urraca 等的 ERA5 全球水平辐照(GHI)评估,2018 年发表于 Solar Energy(卷 164,339–354 页),用全球高质量地面站与卫星产品逐日对账,是辐照偏差领域的奠基性参考。
  • 气温 / 复杂地形:Zhao 与 He 的《A First Evaluation of ERA5-Land Reanalysis Temperature Product Over the Chinese Qilian Mountains》,2022 年发表于 Frontiers in Earth Science,在祁连山区用站点观测验证 ERA5-Land 2 m 气温,揭示了海拔差驱动的系统偏差。

三篇分属顶刊与权威开放期刊,方法都是"格点对站点"的逐点验证,结论方向高度一致:ERA5 整体优于前代再分析,但偏差并不为零,且在复杂地形、近海、山区会明显放大。

方法 / 它做了什么

三项工作的共同套路,是把 ERA5 格点值与就近站点观测做逐时或逐日配对,再统计平均偏差(MBE / mean bias)、均方根误差(RMSE)与相关系数,并把误差按地理与海拔分层观察。

Olauson 的做法是把 ERA5 与 MERRA-2 两套再分析分别驱动风电出力模型,在国家级聚合层面和单台风机层面,同时与实测风电出力对账,看哪套再分析重建的小时级容量因子更贴近真值、长期订正不确定性更低。

Urraca 等则同时调用三类独立标尺:全球 41 个 BSRN 基准辐射网站点、欧洲 294 个地面站,以及 NSRDB 与 SARAH 两套卫星辐照产品,对 ERA5 与区域再分析 COSMO-REA6 的 GHI 逐站逐日做误差统计——既看相对地面真值的系统偏差,也看相对成熟卫星产品的相对位置。

Zhao 与 He 用祁连山区 17 个气象站验证 ERA5-Land 月尺度 2 m 气温,重点不只算总体误差,还把每个站的偏差对"ERA5-Land 格点高程与站点实际海拔之差"做回归,量化地形高差对偏差的解释力。这一步正是复杂地形用户最该关心的。

关键结论

把核实过的数字拎出来,最有工程价值的是这几条:

  1. 风电侧:ERA5 平均误差比 MERRA-2 低约 20%。 Olauson 报告 ERA5 在小时级建模的平均绝对误差与均方根误差平均比 MERRA-2 低约 20%,长期订正相关的不确定性也低约 20%;甚至用 1 年 ERA5 样本得到的估计精度,略优于用 2 年 MERRA-2 样本。注意这是在风电出力建模评测口径下、相对 MERRA-2 的相对改善,不等于 ERA5 在任意单点风速上都无需订正。
  2. 辐照侧:ERA5 GHI 全球平均正偏差约 +4.05 W/m²(欧洲约 +4.54 W/m²),比前代明显收窄。 相对 ERA-Interim 与 MERRA-2,ERA5 的平均偏差降幅约 50%–75%;约 80% 的站点表现为高估,但在 60% 的欧洲站点偏差落在 ±5 W/m² 以内。代价是沿海与山区明显退化——挪威、英国、法国、西班牙海岸的偏差会上升。
  3. 气温侧:复杂地形存在以冷偏差为主、随海拔差放大的系统误差。 Zhao 与 He 在祁连山区得到 ERA5-Land 月偏差平均约 −1.3°C(范围 −5.6 至 +1.6°C),平均 RMSE 约 2.2°C;月偏差与高程差的回归 R² 约 0.535,冬季更高(约 0.633)。这说明山区气温偏差很大一部分由"格点高程不等于站点海拔"造成,可用直减率(lapse rate)订正显著改善。
  4. 共性规律:平地准、地形与近海退化。 三项工作方向一致——ERA5 在地形平缓、要素变率低的区域可媲美卫星或直接可用;越靠近海岸、山区、高海拔,局地物理越被约 31 km 网格平滑掉,偏差越大。这一条应当写进数据使用纪律,而非个案。

对新能源 / 运梦平台的意义

风资源评估:ERA5 长序列风速可作为测风塔短期实测的长期参证(MCP)底座,但务必先用塔上同期数据做一次站点级偏差订正与切变外推,再做多年风资源重建;Olauson 的结论支持"ERA5 优先于 MERRA-2",但不等于免订正。

光伏辐照分析:内陆电站可把 ERA5 GHI 当资源评估主力,叠加约 +4 W/m²(欧洲约 +4.5 W/m²)量级的系统正偏差订正即可;沿海、山地项目应把 ERA5 当"第一近似",再用卫星辐照或现场辐照计交叉校核。

功率预测训练样本:历史再分析常是预测模型训练与偏差订正的输入底座。先把 ERA5 相对本场观测的系统偏差扣掉,再喂给模型,能让训练分布更接近真实分布、订正层更稳——尤其在山区电站,气温与风速的地形偏差会直接污染特征。

电网与气温敏感负荷:用 ERA5 气温做负荷或温控相关分析时,山区与高海拔点应配合海拔差做直减率订正,否则冷偏差会系统性低估。

在运梦气象 API 上手

南京运梦科技的运梦气象 API 同时提供 ERA5德国气象局双数据源:历史回测、偏差验证与长期资源分析用 ERA5,短期预报落地用德国气象局。两者都通过 downloadSync 接口、按 dataSourceIdfields 拉取。做站点偏差验证时,建议先拉取目标点位的 ERA5 历史序列,再与本场观测逐时配对算 MBE / RMSE。

{
  "dataSourceId": "era5",
  "lat": 38.0,
  "lon": 100.2,
  "stime": "2023-01-01 00:00",
  "etime": "2023-12-31 23:00",
  "fields": ["ws", "wd", "u100", "v100", "rsds", "tas"],
  "timezone": "8"
}

ws / wd / u100 / v100 用于风速风向偏差与切变检查,rsds 为地表下行短波辐照(GHI)用于辐照偏差,tas 为 2 m 气温用于配合海拔差做直减率订正。预报场景把 dataSourceId 切为 ger(德国气象局)即可,其余结构不变。

更多上手信息见 ERA5 数据源产品页德国气象局预报;接口与字段细节见 API 参考数据要素解释;行业落地见 光伏功率预测风电功率预测。延伸阅读可看 ERA5 风电建模解读ERA5 太阳辐照精度评估

常见问题

ERA5 数据可以直接拿来用吗? 不建议直接用。ERA5 是约 31 km 网格的再分析格点产品,与机位、组件、测风塔所在具体点存在可量化的系统偏差,风资源评估、辐照分析、功率预测训练前应先用本场观测做站点级偏差订正。

ERA5 和 MERRA-2 哪个更适合风电建模? 按 Olauson 2018 的风电出力建模评测,ERA5 的平均误差与长期订正不确定性平均比 MERRA-2 低约 20%,甚至 1 年 ERA5 样本的估计精度略优于 2 年 MERRA-2 样本,因此风电建模优先选 ERA5。

ERA5 的辐照偏差有多大、怎么订正? Urraca 2018 测得 ERA5 GHI 全球平均正偏差约 +4.05 W/m²(欧洲约 +4.54 W/m²),约 80% 站点高估。内陆电站可叠加约 +4 W/m² 量级的系统正偏差订正后作资源评估主力;沿海、山地项目应把 ERA5 当第一近似,再用卫星辐照或现场辐照计交叉校核。

为什么 ERA5 在山区气温偏差更大? 因为 ERA5-Land 格点高程往往不等于站点实际海拔。Zhao 与 He 2022 在祁连山区测得月偏差平均约 −1.3°C,且偏差与高程差回归 R² 约 0.535(冬季约 0.633),用直减率(lapse rate)按海拔差订正可显著改善。

在运梦气象 API 上怎么做 ERA5 站点偏差验证? 通过 downloadSync 接口、用 dataSourceIdera5 拉取目标点位历史序列(如 ws / wd / u100 / v100 / rsds / tas),再与本场观测逐时配对计算 MBE / RMSE;短期预报场景把 dataSourceId 切为 ger(德国气象局)即可。

引用与原文

Olauson, J. (2018). ERA5: The new champion of wind power modelling? Renewable Energy, 126, 322–331. DOI: 10.1016/j.renene.2018.03.056

Urraca, R., Huld, T., Gracia-Amillo, A., Martínez-de-Pisón, F. J., Kaspar, F., & Sanz-García, A. (2018). Evaluation of global horizontal irradiance estimates from ERA5 and COSMO-REA6 reanalyses using ground and satellite-based data. Solar Energy, 164, 339–354. DOI: 10.1016/j.solener.2018.02.059

Zhao, P., & He, Z. (2022). A First Evaluation of ERA5-Land Reanalysis Temperature Product Over the Chinese Qilian Mountains. Frontiers in Earth Science, 10, 907730. DOI: 10.3389/feart.2022.907730

Gao, L., Bernhardt, M., Schulz, K., & Chen, X. (2017). Elevation correction of ERA-Interim temperature data in the Tibetan Plateau. International Journal of Climatology, 37(9), 3540–3552. DOI: 10.1002/joc.4935