风电

ERA5 是风电建模新标杆吗?Olauson 2018 顶刊基准论文解读

· 南京运梦科技算法团队 · 评审 算法负责人

ERA5 是风电建模新标杆吗?Olauson 2018 顶刊基准论文解读 封面

如果你做风资源评估、风电功率回测或长时间序列建模,几乎一定会遇到一个绕不开的问题:用哪套再分析数据来"还原"过去几十年的风况?2018 年发表在 Renewable Energy 上的一篇论文,系统性地把 ERA5 和当时业界广泛使用的 MERRA-2 放在同一张验证台上对比,并给出了清晰的结论。这篇文章后来成为后续大量风资源研究反复引用的对比基线,是讨论"再分析数据选型"时值得一读的奠基性文献。本文基于已核实事实,对这篇论文做一次面向新能源与气象数据从业者的中文解读。

关键要点

  • Olauson 2018 年发表于 Renewable Energy 的论文,系统对比了 ERA5 与 MERRA-2 在风电建模上的表现,结论是 ERA5 全面胜出。
  • 在与 MERRA-2 的对照中,ERA5 的相关性更高、MAE / RMSE 平均约低 20%,小时级出力及其变化(ramp)分布也更贴近实测。
  • ERA5 对海上与平坦地形尤为可靠;复杂地形、山地、风口等局地效应强的场景仍需叠加降尺度或本地订正。
  • 验证采用"宏观聚合 + 微观单机"双层设计:对照五个国家的聚合发电量,以及瑞典 1,051 台风机的单机实测出力。
  • 该文截至 2026 年 5 月引用量已达 455 次,是 ERA5 用于风电建模的奠基性基准文献。

背景与权威性

这篇论文的英文原题是 ERA5: The new champion of wind power modelling?,作者为瑞典乌普萨拉大学(Uppsala University)的 Jon Olauson,发表于 Renewable Energy(2018 年)——可再生能源领域公认的顶级期刊之一。

衡量一篇论文的影响力,引用量是一个直接的指标。据 Semantic Scholar 在 2026 年 5 月的核实,该文引用量已达 455 次。450 余次引用对一篇相对聚焦的方法学论文而言相当可观,它意味着这篇文章不只是被读过,而是被一代又一代的后续研究当作参照系在用。

它的权威性来自三层叠加:其一,顶刊 Renewable Energy 的审稿门槛;其二,450+ 的引用规模;其三,也是最关键的一点——它是 ERA5 用于风电建模的奠基性基准文献。ERA5 是 ECMWF(欧洲中期天气预报中心)推出的第五代再分析数据集,在它发布之初,业界缺乏一份系统、用真实发电数据验证过的"ERA5 到底好不好用"的结论。这篇论文恰好填补了这个空白,因此被后续的风资源评估工作反复引用为对比基线。换句话说,今天你看到一篇"我们用 ERA5 做风电建模"的论文,它的"为什么选 ERA5"那一段,背后多半站着这篇文章。

标题里的 "champion / new champion"(新标杆 / 新冠军)是论文作者本人的措辞,本文仅作为原文标题引用,并非对任何产品的评价。

它做了什么

这篇论文的核心是一次"用真实发电量说话"的对照验证,方法论可以拆成三步来理解。

1. 构建两套风电出力模型

作者分别用 ERA5MERRA-2 两套再分析数据作为驱动,建立风电出力模型。MERRA-2 是 NASA 的再分析产品,在 ERA5 普及之前,是风能领域使用很广的历史气象数据源。把两者放在同一套建模框架下,差异就只来自数据本身,对比才公平。

2. 用两个层级的实测数据验证

验证数据分两个粒度:

  • 聚合层级:对照五个国家的聚合实测发电量。聚合数据反映的是区域整体出力,对系统级电量评估、并网消纳分析尤其重要。
  • 单机层级:对照瑞典 1,051 台风机的单机实测出力。单机数据更细,能检验模型在个体机位、复杂局地风况下的表现。

这种"宏观聚合 + 微观单机"的双层验证设计,让结论既有统计代表性,又能落到单台机组的颗粒度。

3. 多维度评估指标

论文不只看总量对不对,还系统比较了相关性、平均绝对误差(MAE)、均方根误差(RMSE),以及小时级出力及其变化(ramp)的分布是否贴近实测。对风电而言,"出力的时序变化分布"往往比"总量"更难拟合,也更有调度价值——这一点决定了模型能不能用于功率波动、爬坡事件这类场景。

关键结论

基于已核实事实,论文的核心结论可以归纳为三条:

  • ERA5 在与 MERRA-2 的对照中全面胜出:相关性更高,MAE / RMSE 平均约低 20%。也就是说,换用 ERA5 作为驱动数据,误差水平有一个清晰的下降。
  • 小时级出力及其变化分布更贴近实测:ERA5 不仅总量更准,连出力随时间起伏的形态都更接近真实发电曲线。这对捕捉风电的间歇性、波动性尤为关键。
  • 对海上与平坦地形尤为可靠:在海上风电和平坦地形这两类场景下,ERA5 的表现尤其稳健。这与再分析数据的物理特性一致——地形越简单、下垫面越均一,网格化数据对真实风况的还原度越高。

需要强调的是,论文呈现的是 ERA5 相对 MERRA-2 的系统性优势,而非 ERA5 在所有地形下都完美。复杂地形、山地、风口等局地效应强的场景,仍然是任何全球再分析数据的共同难点,需要叠加降尺度或本地订正。

对新能源 / 运梦平台的意义

把论文结论映射到工程实践,至少有三层启示。

第一,历史风资源评估的数据底座选择。 风资源评估、容量配置、发电量预估高度依赖长时间序列的历史气象数据。这篇论文用真实发电量证明了 ERA5 在风电建模上的整体优势,意味着把 ERA5 作为风资源评估的历史数据底座,是有顶刊证据支撑的选择,而不是凭感觉。

第二,功率预测模型的训练样本质量。 风电功率预测模型(无论是统计方法还是机器学习)都需要大量"气象输入—实测出力"配对样本来训练和回测。驱动数据的误差会直接传导到模型表现。误差平均约低 20%、且出力变化分布更贴近实测,意味着用 ERA5 构建的训练样本,更接近真实的风—电映射关系。

第三,场景适配的判断。 论文指出 ERA5 对海上与平坦地形尤为可靠——这给海上风电、平原 / 戈壁陆上风电的历史评估提供了更强的信心;而复杂地形项目则应预留降尺度与本地实测订正的工作量。

南京运梦科技的运梦气象 API 同时提供 ERA5德国气象局双数据源:ERA5 适合做历史回测、长序列建模与功率预测训练样本,德国气象局则面向预报场景。两者结合,可以覆盖"用历史数据训练 / 验证、用预报数据上线运行"的完整链路。具体产品说明见 /products/weather-api/era5//products/weather-api/ger/,风电与光伏的解决方案分别见 /solutions/wind-power//solutions/photovoltaic/

在运梦气象 API 上手

要把论文的思路落到代码,关键是拿到对的字段。运梦气象 API 通过 downloadSync 接口,按 dataSourceIdfields 拉取某点、某时间段的变量。

针对风电场景,常用字段是 u100 / v100(100 米高度的纬向、经向风分量)以及派生的 ws / wd(风速、风向)——风电出力对轮毂高度附近的风速最敏感,100 米风分量是建模的主力字段。若需补充常规气象背景,可加 tas / hurs / sp / pr(气温、相对湿度、气压、降水)。光伏场景则常用 rsds / dni / dhi(地面短波辐射、直接法向辐照、散射水平辐照)。

下面是一个面向风电建模的最小请求示例,把 dataSourceId 设为 era5,拉取 100 米风分量与派生风速风向:

{
  "dataSourceId": "era5",
  "lat": 37.5,
  "lon": 122.1,
  "stime": "2024-01-01 00:00",
  "etime": "2024-12-31 23:00",
  "fields": ["u100", "v100", "ws", "wd"],
  "timezone": "8"
}

拿到一整年的小时级 100 米风序列后,就可以按论文的思路推进:先用功率曲线把风速映射为出力,再与实测发电量对照,评估相关性、MAE / RMSE,并检查小时级出力变化分布是否贴近实测。若要把历史回测延伸到上线预报,把 dataSourceId 换成 ger 即可复用同一套字段与代码框架。

字段口径与单位以官方文档为准:完整字段表见 /docs/weather/data-elements/,接口参数见 /docs/weather/api-reference/。风电、光伏的功率预测能力分别见 /products/wind-forecast//products/solar-forecast/

常见问题

风电建模用 ERA5 还是 MERRA-2 更好?

按 Olauson 2018 论文的结论,ERA5 在与 MERRA-2 的对照中全面胜出:相关性更高,MAE / RMSE 平均约低 20%。换用 ERA5 作为驱动数据,误差水平有一个清晰的下降。

ERA5 相比 MERRA-2 误差能降低多少?

论文用真实发电量验证后给出的结果是,ERA5 的 MAE / RMSE 平均约低 20%,且小时级出力及其变化分布更贴近实测发电曲线。

ERA5 在所有地形下都更准吗?

不是。论文呈现的是 ERA5 相对 MERRA-2 的系统性优势,ERA5 对海上与平坦地形尤为可靠;但复杂地形、山地、风口等局地效应强的场景仍是任何全球再分析数据的共同难点,需要叠加降尺度或本地订正。

用运梦气象 API 做风电建模该拉哪些字段?

风电场景常用 u100 / v100(100 米高度的纬向、经向风分量)以及派生的 ws / wd(风速、风向),把 dataSourceId 设为 era5 即可拉取历史小时级风序列;需要补充常规气象背景时可加 tas / hurs / sp / pr。

历史回测和上线预报能复用同一套代码吗?

可以。运梦气象 API 同时提供 ERA5 与德国气象局双数据源,两者字段口径一致:用 era5 做历史回测与训练样本,把 dataSourceId 换成 ger 即可复用同一套字段与代码框架跑上线预报。

引用与原文

Olauson, J. (2018). ERA5: The new champion of wind power modelling? Renewable Energy.

DOI: doi.org/10.1016/j.renene.2018.03.056