Pangu-Weather 解读:3D 神经网络如何重塑中期全球天气预报

如果你做风电选址、光伏功率预测,或者每天都在和历史气象数据打交道,那么 2023 年发表在 Nature 上的这篇论文几乎是绕不开的一道分水岭:它第一次让一个"学出来"的 AI 模型,在中期全球天气预报的精度上全面比肩、甚至超过了运行了几十年的传统数值天气预报(NWP)。更关键的是,它把一次全球预报的推理时间从超级计算机上的数小时压缩到了几秒级别。对于需要频繁拉取气象初始场、反复做功率预测和资源评估的新能源从业者来说,这意味着"预报"这件事的成本结构正在被重写。本文就来客观拆解这篇论文做了什么、结论可信在哪里,以及它对运梦平台用户意味着什么。
关键要点
- Pangu-Weather 由华为云团队提出,2023 年发表于 Nature 正刊,是首个在精度上全面胜过传统数值天气预报(NWP)的 AI 天气模型。
- 核心方法是 3D Earth-Specific Transformer(3DEST) 加分层时间聚合策略,把大气三维耦合与地球球面几何先验直接编码进网络,并抑制长程预报的误差累积。
- 模型用 1979-2017 年共 39 年的逐小时 ERA5 训练(2019 年验证、2018 年测试),规模约 2.56 亿参数;ERA5 同时承担训练、初始条件与检验基准三重角色。
- 一次全球预报的推理速度相比传统 NWP 提升约一万倍(约 10000×),但该加速指的是出报阶段,模型训练仍是一次性高成本投入。
- 对新能源业务而言,它验证了以长序列 ERA5 为底座的资源评估范式,并大幅降低高频功率预测的出报算力门槛;运梦气象 API 据此同时提供 ERA5 与德国气象局双数据源。
背景与权威性
这篇论文的英文原题是 Accurate medium-range global weather forecasting with 3D neural networks,业界通常以其模型名称称呼它 —— Pangu-Weather。作者为 Bi、Xie、Zhang、Chen、Gu、Tian,出品方是 Huawei Cloud(华为云),发表于 Nature(2023)正刊。
衡量一篇论文的权威性,期刊层级、作者背景和被引情况是三个最直接的维度。
- 期刊层级:Nature 是综合性自然科学领域公认的权威期刊,正刊(而非子刊)对方法新颖性和结论可复现性的要求十分严苛。一篇 AI 气象模型能登上 Nature 正刊,本身就说明它的贡献超出了"工程改进"的范畴。
- 被引与影响力:据 Semantic Scholar(2026-05 核实),该论文引用量约 1,565。在 AI 气象这个相对年轻的细分领域,这是一个相当可观的数字,反映出它被学术界与工业界广泛参考、复现和讨论。
- 里程碑地位:它被广泛视为首个在精度上全面胜过传统 NWP 的 AI 天气模型。论文与模型开源后,被大量后续研究复现、对比和采用,成为后来一系列 AI 气象大模型绕不开的对照基准。
换句话说,无论你是想入门 AI 气象、还是想给自己的技术选型找一篇文献来对标,这篇都属于该主题下的经典与前沿文献之一。
它做了什么
Pangu-Weather 的核心,是用一个端到端的深度学习模型,去替代传统数值预报中"求解大气物理方程组"的那一整套流程。它的方法、数据和验证方式可以拆成三块来看。
方法:3D Earth-Specific Transformer 与分层时间聚合
论文提出了一种名为 3D Earth-Specific Transformer(3DEST) 的网络结构,以及配套的分层时间聚合(hierarchical temporal aggregation)策略。
- 为什么要"3D"和"Earth-Specific":大气是一个三维的物理系统 —— 不同高度层(气压层)之间存在强耦合,地球又是一个有经纬度、有球面几何的特殊载体。把这些先验直接编码进网络结构,而不是让模型从零去"猜"地球长什么样,是这套方法相比通用视觉模型的关键差异。
- 分层时间聚合:中期预报需要预测未来若干天的状态。与其用一个固定步长的模型反复迭代(误差会逐步累积),不如训练多个面向不同预报时效的模型,再分层组合。这一策略对抑制长程预报的误差累积有直接帮助。
数据:39 年逐小时 ERA5
模型的训练数据来自 ERA5 —— 由 ECMWF 提供的全球再分析数据集。论文使用 1979-2017 年共 39 年的逐小时 ERA5 序列训练模型,并以 2019 年作验证、2018 年作测试,最终模型规模约 2.56 亿参数。
这里有一个值得新能源从业者特别留意的点:AI 气象模型的"知识"完全来自它"吃"进去的再分析数据。ERA5 作为物理自洽、时空连续的长期数据底座,正是这类模型得以成立的前提。
验证:以 ERA5 为初始条件与检验基准
论文用 ERA5 同时承担了两个角色:
- 提供初始条件:预报需要一个"起点",即当前时刻的大气状态,这一初始场由 ERA5 提供。
- 作为检验基准:预报结果的好坏,需要和"真实发生的天气"对比。论文以 ERA5 作为检验基准来评估预报精度。
这种用同一套权威数据既训练、又起报、又检验的设计,让结果的可比性和可复现性都更强。
关键结论
回到这篇论文最被反复引用的几条结论,这里只陈述已核实的事实:
- 精度上全面比肩传统 NWP:Pangu-Weather 是首个在精度上全面胜过传统数值天气预报的 AI 模型。这打破了"AI 预报只是快、但不够准"的固有印象。
- 推理速度较传统 NWP 提升约一万倍:得益于 3DEST 与分层时间聚合策略,一次全球预报的推理速度相比传统 NWP 提升了约一万倍(约 10000×)。传统 NWP 需要在超级计算机上耗费大量算力求解物理方程,而训练好的神经网络只需一次前向推理。
- 可复现、可采用:模型开源后被广泛复现与采用,结论经受住了社区的反复检验。
需要强调的是,"速度提升约一万倍"指的是推理(出报)阶段,模型训练本身仍然是一次性的高成本投入。但对实际业务而言,真正高频发生的恰恰是"出报"这一步。
对新能源 / 运梦平台的意义
把上面的结论映射到风电、光伏的实际业务,意义就具体起来了。
一是资源评估的训练数据范式被验证。 Pangu-Weather 证明了以长序列 ERA5 为底座训练气象模型这条路是可行且高质量的。对做风资源 / 光伏资源评估的团队来说,这反过来强化了 ERA5 作为长期评估数据源的地位 —— 无论你是直接用 ERA5 做历史风速 / 辐射统计,还是拿它训练自己的偏差订正模型,都站在了同一套被顶刊验证过的数据底座上。
二是高频出报让功率预测的迭代成本下降。 风电、光伏的短期功率预测往往需要频繁更新预报、滚动订正。AI 模型训练一次、推理极快的特性,意味着出报环节的算力门槛被大幅拉低,让更高频次的预测更新、更密集的情景模拟在工程上变得现实。
三是初始条件的质量直接决定预报质量。 论文用 ERA5 提供初始条件这一设计提醒我们:AI 也好、传统 NWP 也好,初始场的质量是预报上限的天花板。在生产中,风电用的 100m 风速场、光伏用的地表辐射场,其初始数据的精度和一致性,往往比模型本身更影响最终的出力预测结果。
南京运梦科技在落地这类能力时,把"用对、用好权威数据源"放在前面 —— 这也是运梦气象 API 同时提供 ERA5 与德国气象局双数据源的出发点。
在运梦气象 API 上手
理解了论文,下一步自然是动手。运梦气象 API 提供 ERA5 与 德国气象局 双数据源:前者适合做长期历史气象与资源评估、模型训练的标准答案,后者(dataSourceId=ger)适合做面向未来 ~7 天的预报。
数据通过 downloadSync 接口按 dataSourceId 与 fields 拉取,字段按场景选取:
- 风资源 / 风电功率预测:
u100、v100、ws、wd(100m 风的 u/v 分量、风速、风向); - 光伏资源 / 光伏功率预测:
rsds、dni、dhi(地表下行短波辐射、直接法向辐照、散射水平辐照); - 常规气象:
tas、hurs、sp、pr(近地面气温、相对湿度、地面气压、降水)。
下面是一个拉取 ERA5 风资源字段的简化思路示例:
POST /downloadSync
{
"dataSourceId": "era5",
"fields": ["u100", "v100", "ws", "wd"],
"lat": 32.06,
"lon": 118.78,
"stime": "2024-01-01 00:00",
"etime": "2024-12-31 23:00",
"timezone": "8"
}
如果是做面向未来的预报,把 dataSourceId 切换为 ger(德国气象局)即可,字段选取逻辑一致。
延伸阅读与产品页:
- ERA5 历史再分析数据:/products/weather-api/era5/
- 德国气象局预报数据:/products/weather-api/ger/
- 风电解决方案:/solutions/wind-power/ | 风电功率预测:/products/wind-forecast/
- 光伏解决方案:/solutions/photovoltaic/ | 光伏功率预测:/products/solar-forecast/
- 接口与字段:API 参考 | 数据要素解释
常见问题
Q:Pangu-Weather 是什么?它为什么重要? A:Pangu-Weather 是华为云团队提出、2023 年发表于 Nature 正刊的 AI 天气模型,用端到端深度学习替代传统数值预报中求解大气物理方程组的流程。它被广泛视为首个在精度上全面胜过传统 NWP 的 AI 天气模型,因而成为后续 AI 气象大模型的对照基准。
Q:Pangu-Weather 比传统数值预报快多少? A:一次全球预报的推理速度相比传统 NWP 提升约一万倍(约 10000×)。需要注意的是,这个加速指的是推理(出报)阶段;模型训练本身仍然是一次性的高成本投入。
Q:Pangu-Weather 用什么数据训练? A:模型使用 ECMWF 提供的 ERA5 全球再分析数据,取 1979-2017 年共 39 年的逐小时序列训练,并以 2019 年作验证、2018 年作测试,最终模型规模约 2.56 亿参数。ERA5 在论文中同时承担训练、提供初始条件和检验基准三重角色。
Q:3D Earth-Specific Transformer(3DEST)解决了什么问题? A:3DEST 把大气不同高度层之间的三维耦合和地球的球面几何先验直接编码进网络结构,而不是让模型从零去猜地球的样子;配套的分层时间聚合策略则用多个面向不同预报时效的模型分层组合,抑制长程预报的误差累积。
Q:我能在运梦气象 API 上获取 ERA5 和预报数据吗?
A:可以。运梦气象 API 同时提供 ERA5(dataSourceId=era5)与德国气象局(dataSourceId=ger)双数据源,前者适合长期历史气象与资源评估、模型训练,后者适合面向未来约 7 天的预报,均通过 downloadSync 接口按 dataSourceId 与 fields 拉取。
引用与原文
Bi, K., Xie, L., Zhang, H., Chen, X., Gu, X. & Tian, Q. Accurate medium-range global weather forecasting with 3D neural networks. Nature (2023). Huawei Cloud.