风电

ERA5 是风电建模新标杆吗？Olauson 2018 顶刊基准论文解读

2022-04-21 · 南京运梦科技算法团队 · 评审算法负责人

如果你做风资源评估、风电功率回测或长时间序列建模，几乎一定会遇到一个绕不开的问题：用哪套再分析数据来"还原"过去几十年的风况？2018 年发表在 Renewable Energy 上的一篇论文，系统性地把 ERA5 和当时业界广泛使用的 MERRA-2 放在同一张验证台上对比，并给出了清晰的结论。这篇文章后来成为后续大量风资源研究反复引用的对比基线，是讨论"再分析数据选型"时值得一读的奠基性文献。本文基于已核实事实，对这篇论文做一次面向新能源与气象数据从业者的中文解读。

关键要点

Olauson 2018 年发表于 Renewable Energy 的论文，系统对比了 ERA5 与 MERRA-2 在风电建模上的表现，结论是 ERA5 全面胜出。
在与 MERRA-2 的对照中，ERA5 的相关性更高、MAE / RMSE 平均约低 20%，小时级出力及其变化（ramp）分布也更贴近实测。
ERA5 对海上与平坦地形尤为可靠；复杂地形、山地、风口等局地效应强的场景仍需叠加降尺度或本地订正。
验证采用"宏观聚合 + 微观单机"双层设计：对照五个国家的聚合发电量，以及瑞典 1,051 台风机的单机实测出力。
该文截至 2026 年 5 月引用量已达 455 次，是 ERA5 用于风电建模的奠基性基准文献。

背景与权威性

这篇论文的英文原题是 ERA5: The new champion of wind power modelling?，作者为瑞典乌普萨拉大学（Uppsala University）的 Jon Olauson，发表于 Renewable Energy（2018 年）——可再生能源领域公认的顶级期刊之一。

衡量一篇论文的影响力，引用量是一个直接的指标。据 Semantic Scholar 在 2026 年 5 月的核实，该文引用量已达 455 次。450 余次引用对一篇相对聚焦的方法学论文而言相当可观，它意味着这篇文章不只是被读过，而是被一代又一代的后续研究当作参照系在用。

它的权威性来自三层叠加：其一，顶刊 Renewable Energy 的审稿门槛；其二，450+ 的引用规模；其三，也是最关键的一点——它是 ERA5 用于风电建模的奠基性基准文献。ERA5 是 ECMWF（欧洲中期天气预报中心）推出的第五代再分析数据集，在它发布之初，业界缺乏一份系统、用真实发电数据验证过的"ERA5 到底好不好用"的结论。这篇论文恰好填补了这个空白，因此被后续的风资源评估工作反复引用为对比基线。换句话说，今天你看到一篇"我们用 ERA5 做风电建模"的论文，它的"为什么选 ERA5"那一段，背后多半站着这篇文章。

标题里的 "champion / new champion"（新标杆 / 新冠军）是论文作者本人的措辞，本文仅作为原文标题引用，并非对任何产品的评价。

它做了什么

这篇论文的核心是一次"用真实发电量说话"的对照验证，方法论可以拆成三步来理解。

1. 构建两套风电出力模型

作者分别用 ERA5 和 MERRA-2 两套再分析数据作为驱动，建立风电出力模型。MERRA-2 是 NASA 的再分析产品，在 ERA5 普及之前，是风能领域使用很广的历史气象数据源。把两者放在同一套建模框架下，差异就只来自数据本身，对比才公平。

2. 用两个层级的实测数据验证

验证数据分两个粒度：

聚合层级：对照五个国家的聚合实测发电量。聚合数据反映的是区域整体出力，对系统级电量评估、并网消纳分析尤其重要。
单机层级：对照瑞典 1,051 台风机的单机实测出力。单机数据更细，能检验模型在个体机位、复杂局地风况下的表现。

这种"宏观聚合 + 微观单机"的双层验证设计，让结论既有统计代表性，又能落到单台机组的颗粒度。

3. 多维度评估指标

论文不只看总量对不对，还系统比较了相关性、平均绝对误差（MAE）、均方根误差（RMSE），以及小时级出力及其变化（ramp）的分布是否贴近实测。对风电而言，"出力的时序变化分布"往往比"总量"更难拟合，也更有调度价值——这一点决定了模型能不能用于功率波动、爬坡事件这类场景。

关键结论

基于已核实事实，论文的核心结论可以归纳为三条：

ERA5 在与 MERRA-2 的对照中全面胜出：相关性更高，MAE / RMSE 平均约低 20%。也就是说，换用 ERA5 作为驱动数据，误差水平有一个清晰的下降。
小时级出力及其变化分布更贴近实测：ERA5 不仅总量更准，连出力随时间起伏的形态都更接近真实发电曲线。这对捕捉风电的间歇性、波动性尤为关键。
对海上与平坦地形尤为可靠：在海上风电和平坦地形这两类场景下，ERA5 的表现尤其稳健。这与再分析数据的物理特性一致——地形越简单、下垫面越均一，网格化数据对真实风况的还原度越高。

需要强调的是，论文呈现的是 ERA5 相对 MERRA-2 的系统性优势，而非 ERA5 在所有地形下都完美。复杂地形、山地、风口等局地效应强的场景，仍然是任何全球再分析数据的共同难点，需要叠加降尺度或本地订正。

对新能源 / 运梦平台的意义

把论文结论映射到工程实践，至少有三层启示。

第一，历史风资源评估的数据底座选择。 风资源评估、容量配置、发电量预估高度依赖长时间序列的历史气象数据。这篇论文用真实发电量证明了 ERA5 在风电建模上的整体优势，意味着把 ERA5 作为风资源评估的历史数据底座，是有顶刊证据支撑的选择，而不是凭感觉。

第二，功率预测模型的训练样本质量。 风电功率预测模型（无论是统计方法还是机器学习）都需要大量"气象输入—实测出力"配对样本来训练和回测。驱动数据的误差会直接传导到模型表现。误差平均约低 20%、且出力变化分布更贴近实测，意味着用 ERA5 构建的训练样本，更接近真实的风—电映射关系。

第三，场景适配的判断。 论文指出 ERA5 对海上与平坦地形尤为可靠——这给海上风电、平原 / 戈壁陆上风电的历史评估提供了更强的信心；而复杂地形项目则应预留降尺度与本地实测订正的工作量。

南京运梦科技的运梦气象 API 同时提供 ERA5 与 德国气象局双数据源：ERA5 适合做历史回测、长序列建模与功率预测训练样本，德国气象局则面向预报场景。两者结合，可以覆盖"用历史数据训练 / 验证、用预报数据上线运行"的完整链路。具体产品说明见 /products/weather-api/era5/ 与 /products/weather-api/ger/，风电与光伏的解决方案分别见 /solutions/wind-power/ 和 /solutions/photovoltaic/。

在运梦气象 API 上手

要把论文的思路落到代码，关键是拿到对的字段。运梦气象 API 通过 downloadSync 接口，按 dataSourceId 与 fields 拉取某点、某时间段的变量。

针对风电场景，常用字段是 u100 / v100（100 米高度的纬向、经向风分量）以及派生的 ws / wd（风速、风向）——风电出力对轮毂高度附近的风速最敏感，100 米风分量是建模的主力字段。若需补充常规气象背景，可加 tas / hurs / sp / pr（气温、相对湿度、气压、降水）。光伏场景则常用 rsds / dni / dhi（地面短波辐射、直接法向辐照、散射水平辐照）。

下面是一个面向风电建模的最小请求示例，把 dataSourceId 设为 era5，拉取 100 米风分量与派生风速风向：

{
  "dataSourceId": "era5",
  "lat": 37.5,
  "lon": 122.1,
  "stime": "2024-01-01 00:00",
  "etime": "2024-12-31 23:00",
  "fields": ["u100", "v100", "ws", "wd"],
  "timezone": "8"
}

拿到一整年的小时级 100 米风序列后，就可以按论文的思路推进：先用功率曲线把风速映射为出力，再与实测发电量对照，评估相关性、MAE / RMSE，并检查小时级出力变化分布是否贴近实测。若要把历史回测延伸到上线预报，把 dataSourceId 换成 ger 即可复用同一套字段与代码框架。

字段口径与单位以官方文档为准：完整字段表见 /docs/weather/data-elements/，接口参数见 /docs/weather/api-reference/。风电、光伏的功率预测能力分别见 /products/wind-forecast/ 与 /products/solar-forecast/。

常见问题

风电建模用 ERA5 还是 MERRA-2 更好？

按 Olauson 2018 论文的结论，ERA5 在与 MERRA-2 的对照中全面胜出：相关性更高，MAE / RMSE 平均约低 20%。换用 ERA5 作为驱动数据，误差水平有一个清晰的下降。

ERA5 相比 MERRA-2 误差能降低多少？

论文用真实发电量验证后给出的结果是，ERA5 的 MAE / RMSE 平均约低 20%，且小时级出力及其变化分布更贴近实测发电曲线。

ERA5 在所有地形下都更准吗？

不是。论文呈现的是 ERA5 相对 MERRA-2 的系统性优势，ERA5 对海上与平坦地形尤为可靠；但复杂地形、山地、风口等局地效应强的场景仍是任何全球再分析数据的共同难点，需要叠加降尺度或本地订正。

用运梦气象 API 做风电建模该拉哪些字段？

风电场景常用 u100 / v100（100 米高度的纬向、经向风分量）以及派生的 ws / wd（风速、风向），把 dataSourceId 设为 era5 即可拉取历史小时级风序列；需要补充常规气象背景时可加 tas / hurs / sp / pr。

历史回测和上线预报能复用同一套代码吗？

可以。运梦气象 API 同时提供 ERA5 与德国气象局双数据源，两者字段口径一致：用 era5 做历史回测与训练样本，把 dataSourceId 换成 ger 即可复用同一套字段与代码框架跑上线预报。

引用与原文

Olauson, J. (2018). ERA5: The new champion of wind power modelling? Renewable Energy.

DOI: doi.org/10.1016/j.renene.2018.03.056

相关阅读