气象数据

ERA5 能否替代观测驱动模型?北美 3138 流域 HESS 论文解读

· 南京运梦科技算法团队 · 评审 算法负责人

ERA5 能否替代观测驱动模型?北美 3138 流域 HESS 论文解读 封面

当你为一座规划中的风电场做资源评估,却发现最近的气象站在几十公里外、历史序列还断断续续时,再分析数据几乎是唯一能补上这块拼图的现实选择。但一个关键问题始终绕不开:用再分析数据替代地面观测来驱动模型,到底靠不靠谱?2020 年发表在水文领域顶刊 HESS 上的一篇研究,给出了一份覆盖整个北美的系统性答卷。对于做风电、光伏资源评估和功率预测的从业者来说,这篇论文的结论同样值得认真读一遍。

关键要点

  • 这篇 2020 年发表于 HESS 顶刊的论文(Tarek 等,截至 2026 年 5 月被引 535 次),在北美 3,138 个流域上系统评估了 ERA5 能否替代地面观测来驱动水文模型。
  • ERA5 相对地面观测的偏差,比上一代再分析产品 ERA-Interim 出现了系统性的减小,说明从 ERA-Interim 到 ERA5 的质量进步是实打实的。
  • 在大部分地区,用 ERA5 驱动水文模型的模拟性能已与用地面观测驱动相当;唯一仍是观测明显占优的,是美国东半部地区。
  • 模型表现的差异主要来自降水(pr),而非气温——降水是 ERA5 驱动模拟的主要短板,结果不理想时应优先核查降水。
  • 对新能源而言:在缺乏长期实测的站点可用 ERA5 做历史回算与选址初判,但降水类变量需配合本地实测做偏差订正或多源比对。

背景与权威性

这篇论文题为《Evaluation of the ERA5 reanalysis as a potential reference dataset for hydrological modelling over North America》,由 Tarek 等人完成,2020 年发表于 Hydrology and Earth System Sciences(HESS)。HESS 是水文与地球系统科学领域公认的顶级期刊,审稿严格、影响力广泛。

截至 2026 年 5 月,这篇论文在 Semantic Scholar 上的引用量已达 535 次。这个数字背后的含义是:它已经成为"ERA5 能否用于水文建模"这一问题上被反复援引的高引基准研究。在它之后,大量以再分析数据驱动水文与水资源模型的工作,都会把这篇文章列入参考文献,作为论证 ERA5 可用性的标准出处。换句话说,无论你是否同意它的每一条结论,只要你在严肃地讨论"用 ERA5 替代观测来驱动模型",这篇论文几乎是绕不过去的一篇。

对新能源数据从业者而言,水文建模与风光资源评估的底层逻辑高度相通:两者都依赖长序列、高一致性的历史气象场,都关心再分析数据相对地面观测的偏差,也都需要回答"这套数据能不能直接拿来用"。因此,这篇水文领域的经典文献,对气象数据应用同样有很强的参考价值。

它做了什么

这项研究的核心做法可以概括为"大样本 + 多源对比 + 模型驱动"三步。

研究团队在北美选取了 3,138 个流域作为评估样本。如此大的样本量,使得结论不容易被局部地形或个别站点的偶然性所左右,而是能反映出再分析数据在大范围、多种气候与下垫面条件下的整体表现。

在数据层面,研究把 ERA5 的两个关键变量——降水气温——拿出来,与地面观测数据,以及上一代再分析产品 ERA-Interim 进行了对比。这里的对比设计很有讲究:地面观测代表"真值参照",ERA-Interim 代表"上一代水平",三者并置,既能看出 ERA5 相对观测的偏差,也能看出它相对前代产品的进步幅度。

更进一步,研究没有停留在变量本身的统计对比上,而是把这些气象数据分别输入水文模型去实际驱动模拟。这一步很关键:气象变量的统计偏差小,不等于驱动模型后的水文模拟就一定好;只有看模型最终的模拟性能,才能真正回答"这套数据拿来用,效果如何"。这种"既比数据本身、又比下游应用效果"的双层验证方式,正是这篇论文方法上扎实之处。

关键结论

基于上述大样本对比与模型驱动验证,论文给出了几条清晰的结论。

第一,ERA5 相对地面观测的偏差,比上一代的 ERA-Interim 出现了系统性的减小。也就是说,从 ERA-Interim 到 ERA5,再分析数据的质量是实打实在进步的,而且这种改善不是个别地区的偶然,而是带有系统性的。

第二,在大部分地区,用 ERA5 驱动水文模型的模拟性能,已经与用地面观测驱动相当。这是对从业者最有现实意义的一条:在很多区域,再分析数据驱动出来的模拟效果,已经追平了被视为"真值"的地面观测。唯一仍然是观测明显占优的,是美国东半部地区——在那里,地面观测驱动的模拟仍然更好。这提醒我们:ERA5 已经很可用,但"可用"不等于"处处替代观测",区域差异依然存在。

第三,论文进一步指出,模型表现的差异主要来自降水,而不是气温。换言之,限制 ERA5 模拟效果的短板,集中在降水这个变量上;气温的贡献相对次要。这一条对实际工作有直接的指导意义——它告诉我们,当结果不理想时,首先该怀疑和核查的往往是降水。

对新能源 / 运梦平台的意义

虽然这是一篇水文论文,但它的结论可以相当直接地映射到风电与光伏的资源评估与功率预测场景。

再分析能否替代观测

论文显示,ERA5 在大部分地区已能驱动出与观测相当的模拟效果。对风光资源评估而言,这为"在缺乏长期实测的站点用 ERA5 做历史回算与选址初判"提供了一份来自顶刊的参考依据;同时它也提醒,对结果要求严苛的场景,仍应结合本地实测做交叉校验,尤其是论文中指出观测仍占优的区域类型。

代际进步的含义

从 ERA-Interim 到 ERA5 的系统性偏差减小,意味着在新建历史气象数据底座时优先选用 ERA5、而非已停更的旧一代产品,是有据可依的。这与风光长期评估对"序列一致、版本统一"的诉求高度吻合。

降水是主要短板

这条结论提示新能源团队:在使用 ERA5 历史气象数据时,对降水类变量要保持更谨慎的态度,必要时做偏差订正或多源比对;而对气温这类变量,则可以相对更放心地直接使用。这一经验同样适用于功率预测模型的特征工程——把更多质量核查的精力,放在最容易出问题的变量上。

在运梦气象 API 上手

南京运梦科技的运梦气象 API 同时提供 ERA5 与德国气象局双数据源。其中 ERA5 正是上文这篇论文所评估的再分析数据集,可用于风光资源的历史评估与长序列建模。

数据通过 downloadSync 接口按 dataSourceIdfields 拉取。结合论文的启示,字段可按场景选取(以下为参数示意):

# 风资源评估(关注 100m 风)
dataSourceId = era5
fields       = u100,v100,ws,wd

# 光伏辐射评估
dataSourceId = era5
fields       = rsds,dni,dhi

# 常规气象(论文指出 pr 降水是主要短板,需重点核查)
dataSourceId = era5
fields       = tas,hurs,sp,pr

风资源常用 u100 / v100 / ws / wd,光伏常用 rsds / dni / dhi,常规气象用 tas / hurs / sp / pr。需要特别留意的是 pr(降水)——按论文结论,它是再分析驱动模拟时差异的主要来源,建议在使用时配合本地数据做偏差核查。

更多用法可参考:ERA5 产品页德国气象局预报风电解决方案光伏解决方案风电功率预测光伏功率预测,以及 API 参考数据要素解释

常见问题

ERA5 可以替代地面观测来驱动水文模型吗?

可以,但有区域差异。这篇论文显示,在大部分地区用 ERA5 驱动水文模型的模拟性能已与用地面观测驱动相当;唯一仍是观测明显占优的,是美国东半部地区。对结果要求严苛的场景,仍应结合本地实测做交叉校验。

ERA5 和 ERA-Interim 哪个更好?

ERA5 更好。论文发现 ERA5 相对地面观测的偏差比上一代的 ERA-Interim 出现了系统性的减小,这种改善带有系统性而非个别地区的偶然。因此新建历史气象数据底座时优先选用 ERA5、而非已停更的旧一代产品,是有据可依的。

ERA5 用于水文或新能源建模时,最主要的短板是什么?

是降水。论文指出,模型表现的差异主要来自降水而不是气温。这意味着限制 ERA5 模拟效果的短板集中在降水上,结果不理想时应首先怀疑和核查降水变量。

这篇论文为什么值得新能源从业者读?

因为水文建模与风光资源评估的底层逻辑高度相通:两者都依赖长序列、高一致性的历史气象场,都关心再分析数据相对地面观测的偏差。论文用北美 3,138 个流域的大样本验证了 ERA5 的可用性,对风电、光伏资源评估与功率预测同样有很强的参考价值。

在运梦气象 API 上用 ERA5 时,降水字段要注意什么?

按论文结论,降水(pr)是再分析驱动模拟时差异的主要来源。在运梦气象 API 上用 dataSourceId = era5 拉取 pr 等字段时,建议配合本地数据做偏差核查或多源比对,而气温(tas)这类变量则可相对更放心地直接使用。

引用与原文

Tarek 等:Evaluation of the ERA5 reanalysis as a potential reference dataset for hydrological modelling over North America, Hydrology and Earth System Sciences(HESS), 2020.

原文链接:doi.org/10.5194/hess-24-2527-2020