GenCast 论文解读:扩散模型如何把 AI 气象推向概率预报前沿

如果你做风电、光伏的资源评估或功率预测,过去几年大概已经习惯了一个叙事:AI 气象模型在确定性预报上追平甚至反超传统数值天气预报(NWP)。但对新能源调度、爬坡风险、极端天气备件这些真正花钱的环节来说,单条"最可能"的预报远远不够——你需要的是一整族可能的未来,也就是概率/集合预报。Price 等人发表在 Nature(2024)上的 GenCast,正是把 AI 气象从"算得准一条"推进到"算得出一片可能性"的标志性工作,对任何依赖气象数据做风险决策的从业者,都值得认真读一读。
关键要点
- GenCast 由 Google DeepMind 团队(Price 等)提出,发表于 Nature(2024),是首个在概率/集合预报上系统性超越 ECMWF ENS 的 AI 模型。
- 技术路线是把扩散模型适配到地球球面几何,反复采样生成多条物理上合理的预报,构成长达 15 天的集合概率预报。
- 在 97.2% 的检验指标上优于 ECMWF ENS,单块 TPU 约 8 分钟即可出一条预报,对极端天气的刻画尤其出色。
- 训练用约 40 年 ERA5 多层变量,验证也以 ERA5 为初始条件与真值基准,并用 CRPS 等概率评分衡量集合质量。
- 对风电、光伏而言,概率预报让出力区间、爬坡概率与备用安排有了更可信依据;高质量长序列的 ERA5 历史数据底座价值随之上升。
背景与权威性
这篇论文的英文原题是 Probabilistic weather forecasting with machine learning,对应模型名为 GenCast,作者团队来自 Google DeepMind(Price 等)。它发表在 Nature 正刊(2024)——气象与机器学习交叉领域能进入 Nature 主刊本身就说明了同行评议层级与影响力的高度。
从被引情况看,据 Semantic Scholar 于 2026 年 5 月核实,其引用量约为 553,对一篇 2024 年才发表的论文而言属于积累相当快的水平,侧面反映学界与工业界对它的关注度。
为什么说它是该主题的前沿文献?因为在它之前,AI 气象的突破大多集中在确定性预报(给出一条最优轨迹)。GenCast 是首个在概率/集合预报上系统性超越 ECMWF ENS 的 AI 模型——ECMWF ENS 是欧洲中期天气预报中心的业务集合预报系统,长期被视为全球集合预报的标杆之一。GenCast 的意义在于:它代表 AI 气象从确定性正式迈入概率预报这一更接近真实业务需求的阶段。
它做了什么
GenCast 的核心技术选择,是把近年在图像生成领域大放异彩的扩散模型(diffusion model)适配到地球的球面几何上。扩散模型擅长从噪声中逐步生成符合某种分布的样本——把这套思路搬到气象上,就意味着模型不再只输出一张确定的天气图,而是能反复采样、生成多条互不相同但都物理上合理的预报,从而构成一个集合(ensemble)。
基于这套机制,GenCast 可以生成长达 15 天的集合概率预报。集合预报的价值在于:它用一族成员刻画未来的不确定性,让我们能读出某地某时刻出现强风或强辐射波动的概率有多大,而不只是一个点估计。
在数据与训练上,GenCast 使用了约 40 年的 ERA5 多层变量进行训练。ERA5 是 ECMWF 的全球再分析数据集,提供物理一致、时空连续的历史气象场,是当前 AI 气象模型常用的训练底座。在验证环节,论文同样以 ERA5 作为初始条件与真值基准,并采用 CRPS(连续分级概率评分)等概率评分来衡量集合预报的质量——这一点很关键:概率预报不能只看中心值准不准,还要看整个概率分布是否可信,CRPS 正是为此设计的标准指标。
关键结论
把核实过的要点收敛成几条结论:
- 在 97.2% 的检验指标上,GenCast 优于 ECMWF ENS。 这是一个覆盖面相当广的对比结果,意味着它的优势并非个别变量、个别时效上的偶然,而是较为系统性的领先。
- 单块 TPU 约 8 分钟即可出一条预报。 相比传统数值预报动辄需要超算集群跑很久,这种推理成本意味着生成大规模集合(很多条成员)在算力上变得现实可行。
- GenCast 对极端天气的刻画尤其出色。 对新能源行业而言,真正考验调度与风控的往往不是平稳天气,而是台风、寒潮、强对流这类极端事件,这一点的价值不言而喻。
- 方法层面,把扩散模型迁移到球面几何来做概率气象预报,本身就是一条被 Nature 验证可行的技术路线,为后续 AI 集合预报研究提供了范式参考。
需要说明:论文及相关报道中出现的 champion / new champion 等措辞,是原文用以形容其相对 ECMWF ENS 表现的表述,这里仅作为论文原文引用,不构成对任何产品的绝对化宣称。
对新能源与平台的意义
GenCast 的结论可以比较直接地映射到风电、光伏的几个核心场景:
风资源评估与功率预测。 风功率与风速近似呈三次方关系,风速的微小不确定性会被放大成出力的大幅波动。确定性预报只能告诉你预计风速多少,而概率/集合预报能告诉你出力落在某个区间的概率分布。当 GenCast 这类模型把 15 天集合预报的质量做到系统性领先 ECMWF ENS,意味着中长期的风电出力区间估计、爬坡概率、备用容量安排都有了更可信的概率依据。
光伏功率预测。 光伏受云、气溶胶、辐射波动影响显著,短时辐照的不确定性同样适合用概率手段刻画。集合预报能帮助量化某时段辐照骤降的概率,对储能调度和现货市场报价都有参考价值。
历史气象数据的角色没有被削弱,反而被强化。 GenCast 用约 40 年 ERA5 训练、又以 ERA5 作真值基准,恰恰说明:无论 AI 模型多先进,高质量、长序列、物理一致的历史再分析数据始终是训练与评估的地基。对做资源评估、长期电量回测的团队来说,ERA5 这类历史气象数据底座的价值会随着 AI 模型的发展而上升。
评估口径的启示。 GenCast 用 CRPS 评估概率预报,提醒新能源算法团队:当你引入集合或概率方法时,评价指标也要从 RMSE/MAE 这类确定性指标,扩展到 CRPS、可靠性图、覆盖率等概率口径,才能真正衡量区间估计准不准。
在运梦气象 API 上手
GenCast 的训练与评估基准是 ERA5,而 ERA5 正是南京运梦科技的运梦气象 API(双数据源 ERA5 + 德国气象局)对外提供的核心数据源之一。无论你是想复现这类研究的数据准备,还是把历史气象场接入自己的风电、光伏模型,都可以用统一口径直接拉取。
数据通过 downloadSync 接口按 dataSourceId 与 fields 拉取。常用字段约定:
- 风资源:
u100/v100/ws/wd(100m 风分量、风速、风向); - 光伏:
rsds/dni/dhi(地面短波辐射、直接法向辐照、散射水平辐照); - 常规气象:
tas/hurs/sp/pr(2m 气温、相对湿度、地面气压、降水)。
一个最简请求示意:
import requests
payload = {
"dataSourceId": "era5", # 历史再分析;预报场景可换 ger
"lat": 31.5, "lon": 118.5,
"stime": "2024-01-01 00:00",
"etime": "2024-12-31 23:00",
"fields": ["u100", "v100", "ws", "wd", "rsds"],
"timezone": "8",
}
# POST 到 downloadSync 接口,详见 API 文档
想进一步了解数据源与场景落地,可参考:ERA5 产品页、德国气象局预报、风电解决方案、光伏解决方案,以及对应的风电功率预测与光伏功率预测产品页。接口字段与调用细节见API 参考与数据要素说明。
需要提醒的是:GenCast 是研究级的预报模型,与运梦气象 API 对外提供的数据源是两回事;本节只是说明,论文所依赖的 ERA5 历史气象数据,你可以通过运梦气象 API 以一致口径取得,用于自己的训练、回测与评估。
常见问题
GenCast 是什么?它和传统 AI 气象模型有什么不同? GenCast 是 Google DeepMind 团队提出、发表于 Nature(2024)的 AI 气象模型。与此前主要做确定性预报(给出一条最优轨迹)的 AI 模型不同,它把 AI 气象从"算得准一条"推进到"算得出一片可能性",能生成 15 天的集合概率预报。
GenCast 比 ECMWF ENS 强在哪里? 论文报告 GenCast 在 97.2% 的检验指标上优于 ECMWF ENS,是首个在概率/集合预报上系统性超越 ECMWF ENS 的 AI 模型,且对台风、寒潮、强对流等极端天气的刻画尤其出色。
GenCast 用扩散模型做天气预报是怎么实现的? 它把图像生成领域的扩散模型适配到地球球面几何上,通过从噪声中反复采样,生成多条互不相同但都物理上合理的预报,从而构成一个集合,用一族成员刻画未来的不确定性。
GenCast 训练和评估用的是什么数据? GenCast 使用约 40 年的 ERA5 多层变量进行训练,验证环节同样以 ERA5 作为初始条件与真值基准,并采用 CRPS(连续分级概率评分)等概率评分来衡量集合预报质量。
GenCast 对风电、光伏预测有什么实际价值? 概率/集合预报能给出风电出力区间、爬坡概率、备用容量的概率依据,也能量化光伏辐照骤降的概率;同时它提醒算法团队把评估指标从 RMSE/MAE 扩展到 CRPS、可靠性图、覆盖率等概率口径。
引用与原文
Price, I. 等. Probabilistic weather forecasting with machine learning. Nature (2024). DOI: doi.org/10.1038/s41586-024-08252-9