ERA5 vs MERRA-2 光伏出力系统偏差与长时储能误差传播解读

做过新能源资源评估或电力系统建模的人,多半都遇到过一个尴尬时刻:换一套历史气象数据源重跑一遍模型,光伏出力、储能调度甚至整年的能量平衡就全变了。问题往往不在你的代码,而在于"喂"进去的再分析数据本身带着系统偏差。Applied Energy 2023 年发表的这篇研究,正是把 ERA5 与 MERRA-2 两套主流再分析在光伏出力上的系统偏差摆上台面,并进一步追问:这点偏差进入长时储能建模后,会被放大成多大的误差?对任何依赖历史气象数据做长期投资决策的人来说,这是一篇值得认真读一遍的文献。
关键要点
- MERRA-2 在全球范围内系统性高估光伏出力,而 ERA5 更好地复现了真实的计量发电情景。
- 输入侧的光伏出力偏差进入长时储能(LDES)链路后会被放大而非被平均掉,低往返效率正是放大器,会扭曲充放电模式、储能利用率与总能量需求估计。
- 论文给出的工程建议是:从 MERRA-2 迁移到 ERA5,并在此基础上叠加偏差订正,而不是把任一再分析数据的原始输出直接当真值。
- 该研究发表于 Applied Energy(Elsevier),作者来自爱尔兰科克大学 MaREI,截至 2026 年 5 月被引约 15 次,是再分析数据用于能源建模方向的标准参考文献。
- 在运梦气象 API 上,可用
downloadSync按dataSourceId: era5拉取rsds / dni / dhi / tas等辐射要素,再结合本地实测做交叉验证与偏差订正。
背景与权威性
这篇论文发表在 Applied Energy(Elsevier),是能源系统与应用能源领域公认的权威期刊之一,对方法严谨性与工程可复现性要求很高。作者来自爱尔兰科克大学(University College Cork)及其能源研究中心 MaREI(Mathews、Ó Gallachóir、Deane),长期深耕能源系统建模。
从主题定位看,它属于"再分析数据用于能源建模"这一方向上的标准参考文献:直接对比 ERA5 与 MERRA-2 两套被广泛使用的再分析产品在光伏出力上的系统偏差,并给出可操作的工程建模选型与偏差订正建议。截至 2026 年 5 月,它在 Semantic Scholar 上的引用量约为 15 次——对一篇 2023 年发表、聚焦特定方法学问题的论文来说,已被能源系统与储能建模社区稳定采纳和引用。换句话说,它不是泛泛的综述,而是一篇直接影响"该选哪套数据、要不要订正"这类工程决策的文献。
它做了什么
研究的核心是一次"控制变量"式的对照:在尽可能保持其他条件一致的前提下,分别用 ERA5 与 MERRA-2 两套再分析数据驱动同一套光伏出力建模流程,再把两者得到的出力剖面与真实的计量发电情景(metered generation)做比对。
这样的设计有两个好处。其一,它把"数据源差异"从"模型差异"中剥离出来——出力剖面的不同,可以归因到再分析数据本身,而不是建模假设。其二,引入计量发电作为参照,等于给两套再分析数据找了一把可信的"尺子",从而能定量刻画各自相对真实发电的系统偏差,而不仅仅是 ERA5 与 MERRA-2 互相之间的差异。
更进一步,作者没有停在"出力剖面"这一层,而是把带偏差的出力序列接入了长时储能(long duration energy storage, LDES)的系统建模链路,观察偏差在储能这一环节中如何传导、是否被放大,以及最终如何影响充放电模式、储能利用率与整体能量需求的估计。这一步是这篇论文区别于普通"数据对比"工作的关键所在。
关键结论
把研究的几条核心发现拎出来:
- MERRA-2 在光伏出力上存在显著的全球性高估。 也就是说,用 MERRA-2 驱动光伏建模,倾向于系统性地把发电量算高,而这种偏高并非局地现象,而是全球范围内可观察到的系统偏差。
- 这点出力偏差进入长时储能链路后会被放大,而非被平均掉。 在往返效率较低的长时储能场景中,输入侧的光伏出力偏差会沿充放电链路放大,扭曲充放电模式、储能利用率,乃至对总能量需求的估计。直觉上"误差会在长期里相互抵消"在这里并不成立——低往返效率恰恰是放大器。
- ERA5 虽然同样存在系统偏差,但更好地复现了计量发电情景。 相比之下,ERA5 驱动的光伏出力与真实计量发电更接近。因此论文给出的工程建议很明确:对相关建模工作,应考虑从 MERRA-2 迁移到 ERA5,并在此基础上进一步做偏差订正(bias correction),而不是把任何一套再分析数据的原始输出直接当作真值使用。
需要强调的是,论文并没有把 ERA5 描述成"零偏差"的完美数据——它的结论是相对的:在这项对照里,ERA5 是更接近计量发电的那一个,但仍建议叠加订正。
对新能源 / 运梦平台的意义
这篇论文的价值,在于它把一个常被忽视的工程隐患量化了:历史气象数据源的选择本身就是一个会沿建模链路传播的误差来源,尤其在储能这类对长期能量平衡敏感的场景里。
映射到具体业务,可以这样理解:
- 光伏资源评估与选址:如果用系统性高估的数据源做长期发电量评估,得到的容量因子、年发电量很可能偏乐观,进而影响投资测算与并网容量规划。选对再分析数据源、并做偏差订正,是把评估建立在更可靠基线上的前提。
- 功率预测与训练数据:用历史再分析数据作为模型训练或回测基线时,数据源自带的系统偏差会被模型"学进去"。理解偏差的方向(如 MERRA-2 的高估倾向)有助于在特征工程或后处理订正中加以补偿。
- 储能与系统级建模:论文最有警示意义的一点是——低往返效率的长时储能会放大输入偏差。做"光伏+储能"联合优化、容量配置或电力系统长期规划时,输入气象数据的偏差不能假设会自行抵消,反而要重点关注其在储能链路中的传导。
- 历史气象数据的使用纪律:无论用哪套再分析,先用计量/实测数据做交叉验证、再决定是否订正,应当成为常规动作。论文给出的"迁移到 ERA5 + 偏差订正"是一个务实的工程范式。
对使用运梦气象 API 的团队而言,这意味着在做光伏与储能相关分析时,优先采用以 ERA5 为基础的辐射要素,并结合本地实测做偏差订正,是与这篇论文结论一致的做法。
在运梦气象 API 上手
南京运梦科技的运梦气象 API 提供 ERA5 与 德国气象局 双数据源,数据通过 downloadSync 接口按 dataSourceId 与 fields 拉取,便于直接对接上述光伏与储能建模流程。
针对这篇论文关心的光伏出力场景,关键是取对辐射要素:
- 光伏常用字段:
rsds(地表向下短波辐射)、dni(法向直接辐射)、dhi(散射辐射); - 常规气象配套:
tas(气温,影响组件效率)、hurs、sp、pr; - 若同一套流程里还要做风资源评估,可一并取
u100 / v100 / ws / wd。
一个面向 ERA5 的简化取数思路:
POST /downloadSync
{
"dataSourceId": "era5",
"fields": ["rsds", "dni", "dhi", "tas"],
"lat": 32.05,
"lon": 118.78,
"stime": "2010-01-01 00:00",
"etime": "2023-12-31 23:00",
"timezone": "8"
}
拿到逐小时辐射序列后,建议照论文的范式补两步:一是用站点实测或计量发电做交叉验证,二是据此建立偏差订正系数,再把订正后的出力序列接入储能调度模型,避免输入偏差在低往返效率链路中被放大。
更多用法可参考站内页面:ERA5 数据源见 /products/weather-api/era5/,德国气象局预报见 /products/weather-api/ger/;光伏与风电方案见 /solutions/photovoltaic/ 与 /solutions/wind-power/;功率预测产品见 /products/solar-forecast/ 与 /products/wind-forecast/;接口与字段定义见 /docs/weather/api-reference/ 和 /docs/weather/data-elements/。
常见问题
ERA5 和 MERRA-2 哪个更适合做光伏出力建模?
在这篇 Applied Energy 2023 年的对照研究里,ERA5 驱动的光伏出力更接近真实计量发电,MERRA-2 则存在显著的全球性高估。因此论文建议相关建模工作优先采用 ERA5,并在此基础上做偏差订正。
为什么再分析数据的偏差在长时储能里会被放大?
因为长时储能的往返效率较低,输入侧的光伏出力偏差会沿充放电链路传导放大,而不会在长期里自行抵消,最终扭曲充放电模式、储能利用率乃至总能量需求的估计。
用了 ERA5 就不用做偏差订正了吗?
不是。论文并没有把 ERA5 描述成零偏差的完美数据,它同样存在系统偏差,只是相对更接近计量发电。论文建议在迁移到 ERA5 之后仍叠加偏差订正,并先用计量或实测数据做交叉验证。
在运梦气象 API 上做光伏分析该取哪些字段?
光伏出力场景关键是取对辐射要素:rsds(地表向下短波辐射)、dni(法向直接辐射)、dhi(散射辐射),再配套 tas(气温,影响组件效率)等,通过 downloadSync 接口按 dataSourceId 与 fields 拉取。
MERRA-2 的高估倾向对功率预测训练有什么影响?
用历史再分析数据作为模型训练或回测基线时,数据源自带的系统偏差会被模型学进去。理解 MERRA-2 的高估方向,有助于在特征工程或后处理订正中加以补偿。
引用与原文
Mathews, Ó Gallachóir, Deane (2023). Systematic bias in reanalysis-derived solar power profiles & the potential for error propagation in long duration energy storage studies. Applied Energy, Elsevier.