ERA5 全球再分析奠基论文解读:新能源数据的引用金标准

如果你做风电选址、光伏资源评估,或者训练任何"吃"历史气象数据的模型,那么有一篇论文你大概率绕不开——它就是 ERA5 全球再分析的奠基与权威出处。无论是写技术报告、发表论文,还是给投资方做尽调,只要你的数据底座用到了 ERA5,引用这篇文献几乎是默认动作。今天这篇解读,就把这篇被引用约 2.3 万次的"标准文献"讲清楚:它说了什么、为什么权威、以及它对新能源从业者到底意味着什么。
关键要点
- 谁写的、发在哪:论文原题 The ERA5 global reanalysis,由 Hersbach 等人代表 ECMWF 撰写,2020 年发表于 QJRMS(皇家气象学会季刊),由数据生产方亲自撰写,权威性第一手。
- 被引约 2.3 万次:Semantic Scholar 约 23,084 次、Crossref 约 22,518 次(2026 年 5 月核对),是引用 ERA5 数据时的默认标准文献。
- 核心规格:基于 IFS Cy41r2 的 4D-Var 同化系统,约 31km 水平分辨率、137 个垂直层、逐小时输出,并附不确定性集合。
- 时间口径要分清:Hersbach 2020 论文重点说明 1979 年以来的生产系统;当前 CDS 上的 ERA5 单层逐小时数据已回溯扩展到 1940 年至今。
- 规范引用做法:论文 DOI 与数据集 DOI 成对引用,单层逐小时数据集官方 DOI 为
10.24381/cds.adbb2d47,前者解释方法、后者锚定具体数据。
背景与权威性
这篇论文的英文原题是 The ERA5 global reanalysis,由 Hersbach、Bell、Berrisford 等人代表 ECMWF(欧洲中期天气预报中心,也是 Copernicus C3S 气候服务的承担方)撰写,于 2020 年发表在 Quarterly Journal of the Royal Meteorological Society(QJRMS,皇家气象学会季刊)。
为什么说它是该主题绕不开的标准文献?可以从三个维度看:
- 期刊层级:QJRMS 是英国皇家气象学会的旗舰刊物,在大气科学领域有长期的学术声誉,再分析、数据同化这类基础性工作发表在这里具有很高的权威背书。
- 作者 / 出品方:论文由 ERA5 数据集的直接生产方 ECMWF 撰写。换句话说,这不是第三方的转述或评测,而是造数据的人亲自写的说明书,对方法、口径、缺陷的描述具有第一手权威性。
- 引用量级:根据 2026 年 5 月的核对,Semantic Scholar 记录约 23,084 次引用,Crossref 记录约 22,518 次,合计约 2.3 万次。这一引用体量足以说明,它已成为全球引用 ERA5 数据时的默认权威出处。
正因如此,这篇论文在实践中扮演的角色不只是一篇研究,而更像是 ERA5 这套数据的官方技术档案与规范引用入口。
它做了什么
论文系统性地介绍了 ERA5 这套全球再分析数据集的生产方法、数据规格与验证方式。需要先区分两个口径:Hersbach 2020 论文重点说明的是 1979 年以来的 ERA5 生产系统与质量评估;而使用者在当前 CDS 上下载到的 ERA5 单层逐小时数据,已经通过后续回溯扩展覆盖到 1940 年至今。核心可以概括为以下几点(均依据论文与当前 CDS 数据集说明的已核实要点,客观陈述):
同化系统与数据规格
ERA5 基于 IFS Cy41r2 版本的 4D-Var(四维变分)同化系统生产。它的基本规格包括:
- 水平分辨率约 31km;
- 137 个垂直层,覆盖从地表到高空的大气结构;
- 时间覆盖口径:论文重点介绍 1979 年以来的 ERA5;当前 CDS 数据集已经通过后续回溯扩展覆盖到 1940 年至今,提供逐小时的大气、海浪与陆面要素;
- 同时附带不确定性集合(uncertainty ensemble),让使用者能评估数据本身的可信区间。
4D-Var 同化的意义在于:它把多源观测(卫星、地面站、探空、浮标等)在一个时间窗内统一投影到物理一致的模式网格上,从而生成时空连续、物理自洽的历史气象场,而不是简单的站点插值。
验证与文档化
论文不仅给出规格,还记录了同化方案、所采用的输入观测、相对上一代再分析 ERA-Interim 的精度提升,以及已知缺陷。这一点对工程使用尤为关键——它意味着使用者可以在引用数据的同时,明确知道这套数据好在哪里、不能用在哪里,从而做出负责任的判断。也正因为它把这些都写清楚了,这篇论文才成为引用 ERA5 数据时必引的标准文献。
关键结论
把论文已核实的要点提炼为几条关键结论:
- ERA5 提供了基于 4D-Var 同化、约 31km 分辨率、137 垂直层的逐小时全球再分析数据集,并附不确定性集合——Hersbach 2020 是 1979 年以来 ERA5 的方法与质量说明;当前 CDS 数据产品已扩展到 1940 年至今。
- ERA5 相对上一代 ERA-Interim 实现了精度提升,同时论文也明确记录了已知缺陷——这是一份有边界的权威,而非无差别推荐。
- 引用 ERA5 数据时,这篇论文是必引的标准文献——它承担了方法与口径说明书的角色。
- 规范引用建议同时引用本论文与官方数据 DOI:单层逐小时数据集的官方 DOI 为
10.24381/cds.adbb2d47。也就是说,规范的做法是论文 DOI 加数据集 DOI 成对引用,前者解释方法,后者锚定你实际用到的那一份数据。
对新能源 / 运梦平台的意义
对风电、光伏行业来说,这篇论文的价值不在于某个具体数字,而在于它把 ERA5 确立为一套可被规范引用、有据可查、口径稳定的历史气象底座。映射到具体业务:
- 风电资源评估与选址:按当前 CDS 数据产品口径,ERA5 覆盖 1940 年至今的逐小时风场,意味着无需在现场实测多年就能拿到长期风况序列,用于风资源评估、容量配置与发电量回测。论文对方法与缺陷的记录,提醒我们在复杂地形、近海等区域结合本地观测做偏差订正。
- 光伏资源评估:长时间序列的辐射要素可用于光伏长期产能评估、季节性与年际波动分析。
- 功率预测模型训练:当前不少数据驱动的气象与功率预测模型都需要长期、一致、网格化的历史样本,ERA5 正好提供了这种一致的训练底座;而附带的不确定性集合,则为模型评估与风险量化提供了额外信息。
- 历史气象数据使用的合规与可追溯:在对外报告或论文中使用 ERA5 时,把论文 DOI 与数据集 DOI 成对引用,能让你的数据来源经得起审阅与尽调。
南京运梦科技在运梦气象 API中采用 ERA5 + 德国气象局双数据源:ERA5 负责长期、一致的历史回填底座,德国气象局负责近期预报场景,两者互补覆盖"历史评估 + 未来预测"的完整链路。
在运梦气象 API 上手
在运梦气象 API里,ERA5 数据通过 downloadSync 接口按 dataSourceId 与 fields 拉取。字段按新能源场景选取即可:
- 风资源:
u100/v100(100m 纬向 / 经向风分量)、ws(风速)、wd(风向); - 光伏辐射:
rsds(地面入射短波辐射)、dni(直接法向辐照)、dhi(散射水平辐照); - 常规气象:
tas(2m 气温)、hurs(2m 相对湿度)、sp(地面气压)、pr(降水)。
一个最小化的请求体思路(拉取长三角某点一整年的风资源 + 辐射字段):
{
"dataSourceId": "era5",
"lat": 31.5,
"lon": 118.5,
"stime": "2024-01-01 00:00",
"etime": "2024-12-31 23:00",
"fields": ["u100", "v100", "ws", "wd", "rsds", "dni", "dhi"],
"timezone": "8"
}
把它 POST 到 downloadSync 接口即可同步拿到 JSON envelope;data.timeList 与每个字段数组按下标一一对应,字段已按公开字段表统一命名,省去本地维护换名表的麻烦。
延伸阅读与产品入口:
- ERA5 数据源说明:/products/weather-api/era5/
- 预报场景对应的德国气象局预报:/products/weather-api/ger/
- 风电与光伏解决方案:/solutions/wind-power/、/solutions/photovoltaic/
- 风功率与光伏功率预测:/products/wind-forecast/、/products/solar-forecast/
- 接口与字段参考:/docs/weather/api-reference/、/docs/weather/data-elements/
- ERA5 通俗科普:/blog/era5-explained/
常见问题
ERA5 引用哪篇论文?
引用 Hersbach 等人 2020 年发表在 QJRMS 的 The ERA5 global reanalysis,这是 ERA5 数据的标准文献。规范做法是同时引用论文 DOI 与官方数据集 DOI(单层逐小时数据集为 10.24381/cds.adbb2d47)。
ERA5 的时间范围是从哪一年到现在? 要分两个口径:Hersbach 2020 论文重点说明的是 1979 年以来的 ERA5 生产系统;而当前在 CDS 上下载到的 ERA5 单层逐小时数据,已通过后续回溯扩展覆盖到 1940 年至今。
ERA5 的分辨率和垂直层数是多少? ERA5 基于 IFS Cy41r2 的 4D-Var 同化系统生产,水平分辨率约 31km,137 个垂直层,提供逐小时的大气、海浪与陆面要素,并附带不确定性集合。
ERA5 和 ERA-Interim 有什么区别? ERA5 是 ERA-Interim 的下一代再分析。论文记录了 ERA5 相对 ERA-Interim 的精度提升,同时也明确写出了已知缺陷,是一份有边界的权威,而非无差别推荐。
ERA5 适合做风电和光伏的资源评估吗? 适合。按当前 CDS 数据产品口径,ERA5 覆盖 1940 年至今的逐小时风场与辐射要素,可用于风资源评估、容量配置、发电量回测与光伏长期产能分析;论文对方法与缺陷的记录提醒在复杂地形、近海等区域结合本地观测做偏差订正。
引用与原文
规范引用建议同时引用本论文与官方数据集 DOI(10.24381/cds.adbb2d47)。论文标准引用如下:
Hersbach, H., Bell, B., Berrisford, P., et al. (2020). The ERA5 global reanalysis. Quarterly Journal of the Royal Meteorological Society.
原文 DOI:doi.org/10.1002/qj.3803