ERA5-Land 长时序光伏模拟是否下一跃迁?2020 论文解读

如果你做过光伏资源评估或功率预测,一定遇到过这个痛点:想拿到一座电站过去十几年的逐时发电时序,要么没有现场观测,要么观测断断续续。再分析数据本应填补这个空白,但「用再分析重建出来的光伏时序,到底准不准」始终是悬在头顶的问题。Ramírez Camargo 与 Schmidt 在 2020 年的这篇论文,正是把这个问题摆到台面上:当 ECMWF 推出空间更精细的 ERA5-Land 之后,长时序光伏模拟是否迎来了一次实质性跃迁?对任何依赖历史气象数据做新能源建模的人来说,这是一篇绕不开的参考。
关键要点
- Ramírez Camargo 与 Schmidt 2020 年发表于 Elsevier 的论文,把 ERA5-Land 再分析数据与开源 PV_LIB 物理模型结合,生成逐时光伏发电时序。
- 验证用智利 57 座大型光伏电站实测数据,并与基于 MERRA-2 的 Renewables.ninja 平台做对比。
- 对于特征与建模假设相符的电站,模拟精度令人满意;但相较 MERRA-2 方案,ERA5-Land 的提升属于边际改善而非颠覆性飞跃。
- 主要制约不在天气数据本身,而在电站元数据(容量、组件、倾角、朝向、安装方式)的标准化与可得性。
- 截至 2026 年 5 月,该文在 Semantic Scholar 上的引用量约 47,已成为讨论再分析驱动光伏时序时绕不开的参照点。
背景与权威性
这篇论文题为《Simulation of multi-annual time series of solar photovoltaic power: Is the ERA5-land reanalysis the next big step?》,作者为 Ramírez Camargo 与 Schmidt,均出自维也纳农业大学(BOKU Vienna,University of Natural Resources and Life Sciences),2020 年发表于 Elsevier 旗下的 Sustainable Energy Technologies and Assessments。
它的权威性来自一个稀缺的交叉点:它直接针对用 ERA5-Land 做长时序光伏模拟、并用大批量真实电站做验证这一命题。在再分析数据爆发的这些年里,宣称能重建历史光伏发电的工作不少,但真正拿出大批量电站实测数据系统性验证、并把工作流开源、可复现的并不多。截至 2026 年 5 月,该文在 Semantic Scholar 上的引用量约 47,被光伏与能源系统建模领域的文献反复引用,已经成为讨论再分析驱动光伏时序时绕不开的一个参照点。
它做了什么
论文的核心是搭建并验证一条从再分析数据到光伏功率的物理建模链路。
研究把 ERA5-Land 再分析数据与开源的 PV_LIB 物理模型结合,生成逐时的光伏发电时序。PV_LIB 是光伏建模社区广泛使用的物理工具集,负责把气象场(辐照、温度等)经由组件与系统模型转换成发电功率,整个工作流以开源、可复现为目标。
验证环节是这篇论文的分量所在:作者用 智利 57 座大型光伏电站 的实测数据去检验模拟结果。智利北部的高辐照、干旱地区聚集了大量公用事业级电站,是检验光伏模型的理想样本。与此同时,论文还把结果与基于 MERRA-2 再分析数据的 Renewables.ninja 平台做了对比——后者是能源系统研究中被广泛使用的现成时序来源。这样的设计让 ERA5-Land 是否比既有方案更进一步成为一个可以被量化讨论的问题,而不是停留在直觉判断。
关键结论
论文给出的结论既积极又克制,这种分寸本身值得新能源从业者细读。
- 对于那些特征与建模假设相符的电站,模拟精度令人满意。 也就是说,当电站的实际配置、安装方式与模型所假定的条件吻合时,这条 ERA5-Land + PV_LIB 链路能产出可用的逐时光伏时序。
- 相较基于 MERRA-2 的方案,ERA5-Land 带来的提升属于边际级别,而非颠覆性的飞跃。 这呼应了标题里那个带问号的设问——ERA5-Land 是不是下一个大台阶,论文的回答是审慎的:有改善,但没有改变格局。
- 主要制约不在天气数据本身,而在电站级数据的标准化与可得性。 真正卡住精度与可复现性的,往往是电站元数据(容量、组件、倾角、朝向、安装方式等)缺失或口径不统一,而不是再分析数据的分辨率。
这三点合起来传递了一个清醒的信息:再分析数据的进步是必要的,但要把历史光伏发电算准,瓶颈常常落在电站侧信息的质量上。
对新能源 / 运梦平台的意义
把论文结论映射到实际工作,有三层启发。
第一,对历史光伏资源评估:ERA5-Land 这类长时序再分析数据,确实能为没有现场观测的站点提供可用的逐时发电重建底座;但要落到单座电站,必须把电站的真实配置参数对齐到模型假设,否则特征不符会直接拖累精度。
第二,对功率预测与时序建模:论文验证的是物理链路的可信度,这对训练数据预处理很有价值——用再分析驱动的历史时序作为训练或回测样本时,应当先评估目标电站是否落在假设相符的区间内,再决定权重。
第三,对历史气象数据使用的方法论:论文提醒我们,再分析产品的版本更替(如从 MERRA-2 到 ERA5-Land)带来的常是渐进改善,选型时不必盲目追新;把精力投到电站元数据的标准化上,往往回报更高。这也正是南京运梦科技算法团队在光伏与风电方案中反复强调的工程纪律。
在运梦气象 API 上手
运梦气象 API 提供 ERA5 与德国气象局双数据源。要复现论文那种再分析驱动光伏时序的思路,关键是先把光伏建模所需的辐照字段拉齐:常用的是 rsds(地表下行短波辐射)、dni(直接法向辐照)、dhi(散射水平辐照),并搭配 tas(气温)做温度修正,再交给 PV_LIB 之类的物理模型转换为发电功率。如果同时要做风资源对照,可补充 u100 / v100 / ws / wd。
数据通过 downloadSync 接口按 dataSourceId 与 fields 拉取,思路如下:
# 拉取某站点光伏建模所需的逐时辐照与气温(ERA5)
payload = {
"dataSourceId": "era5",
"fields": ["rsds", "dni", "dhi", "tas"],
"lon": -69.5, "lat": -23.5, # 智利北部某点(示例坐标)
"stime": "2010-01-01 00:00",
"etime": "2020-12-31 23:00",
"timezone": "-4", # 智利时区 UTC-4
}
# POST /downloadSync -> 逐时时序,交给 PV_LIB 转换为 PV 功率
字段口径与单位以 数据要素解释 为准,接口参数与鉴权见 API 参考文档。数据源选型可对照 ERA5 产品页 与 德国气象局预报;落到具体场景,可进一步看 光伏解决方案、风电解决方案,以及 光伏功率预测 与 风电功率预测。
一个务实的建议
照论文的经验,跑通数据链路只是第一步;真正决定模拟质量的,是你能否把目标电站的容量、组件、倾角、朝向等参数对齐到物理模型的假设。建议在建模前先做一遍电站元数据核对,再决定是否信任重建出来的历史时序。
常见问题
ERA5-Land 能用来重建历史光伏发电时序吗?
可以。论文把 ERA5-Land 再分析数据与开源 PV_LIB 物理模型结合,生成逐时光伏发电时序;对于实际配置与建模假设相符的电站,模拟精度令人满意。
ERA5-Land 比 MERRA-2 在光伏模拟上更好吗?
有改善,但属于边际级别而非颠覆性飞跃。论文将 ERA5-Land 结果与基于 MERRA-2 的 Renewables.ninja 平台对比后,对「ERA5-Land 是不是下一个大台阶」给出的回答是审慎的:有提升,但没有改变格局。
用再分析数据做光伏时序,最大的瓶颈是什么?
主要制约不在天气数据本身,而在电站级数据的标准化与可得性。电站元数据(容量、组件、倾角、朝向、安装方式等)缺失或口径不统一,往往才是卡住精度与可复现性的关键。
论文用什么数据验证模拟结果?
作者用智利 57 座大型光伏电站的实测数据检验模拟结果。智利北部高辐照、干旱地区聚集了大量公用事业级电站,是检验光伏模型的理想样本。
在运梦气象 API 上要复现这套思路,应该拉取哪些字段?
先把光伏建模所需的辐照字段拉齐:常用 rsds(地表下行短波辐射)、dni(直接法向辐照)、dhi(散射水平辐照),并搭配 tas(气温)做温度修正,再交给 PV_LIB 之类的物理模型转换为发电功率。
引用与原文
Ramírez Camargo, L., & Schmidt, J. (2020). Simulation of multi-annual time series of solar photovoltaic power: Is the ERA5-land reanalysis the next big step? Sustainable Energy Technologies and Assessments, Elsevier.