气象数据

NeuralGCM 解读：物理与机器学习混合的气候模式

2024-01-10 · 南京运梦科技算法团队 · 评审算法负责人

如果你做风电资源评估、光伏长期发电量测算，或者需要把未来几十年的气候情景纳入新能源资产的长期规划，那么 2024 年发表在 Nature 上的这篇 NeuralGCM，值得认真读一遍。过去两年的 AI 气象浪潮里，GraphCast、Pangu-Weather 这类纯数据驱动模型主打的是"中期天气预报"——管好未来 10 天。但新能源行业关心的远不止 10 天：你还要回答"这片海域未来三十年风资源会怎样变化""光伏电站全生命周期的辐射趋势是否被气候变化侵蚀"。这类跨越数十年的问题，传统上只能靠物理气候模式（GCM）回答，而它们极其昂贵。NeuralGCM 的价值，正是把机器学习的速度和物理模式的稳定性"缝"在了一起。

关键要点

NeuralGCM 是 Google Research 2024 年发表于 Nature 正刊（632 卷 8027 期）的混合气候模式，核心是"可微分动力核 + 神经网络参数化"，物理与机器学习可端到端一起训练。
在 1.4° 分辨率下，2–15 天预报中约 95% 的情形 NeuralGCM 精度优于 ECMWF-ENS（集合预报技巧评分口径）。
算力开销约为全球云分辨模式 X-SHiELD 的十万分之一，1.4° 下快约 3500 倍：X-SHiELD 模拟一年大气要约 20 天，NeuralGCM 只要约 8 分钟。
气候积分可稳定数十年；1980–2020 共 40 年区间，2.8° 模型温度误差约为传统纯大气模式的三分之一。
明确边界：NeuralGCM 不能外推到与训练气候差异很大的未来气候；它以 ERA5 再分析为训练真值，与运梦气象 API 历史数据源同源。

背景与定位

这篇论文的英文原题是 Neural general circulation models for weather and climate，业界用模型名称呼它：NeuralGCM。第一作者是 Dmitrii Kochkov 等人（Kochkov, Yuval, Langmore et al.），出品方是 Google Research，论文发表于 2024 年的 Nature 正刊，卷期为 632 卷 8027 期、页码 1060–1066。

判断一篇文献是否值得花时间，通常看发在哪、谁做的、解决什么真问题。NeuralGCM 三点都很硬。

期刊层级：Nature 是公认的顶级综合性期刊之一，气象与机器学习交叉成果能进正刊，门槛本身就是筛子。
出品方与可复现性：Google Research 在科学计算与深度学习领域积累深厚，NeuralGCM 的代码与权重已开源，可复现、可二次开发，影响力远超"只能看不能用"的论文。
范式定位：与 GraphCast 那类"纯黑箱"路线不同，NeuralGCM 是混合（hybrid）路线的代表作——它没有抛弃几十年沉淀的大气物理方程，而是用机器学习去补物理模式最薄弱的环节。这在追求长期可信度的气候模拟里，是一条更稳妥的技术路径。

方法 / 它做了什么

NeuralGCM 的核心思路，可以概括为"可微分动力核 + 神经网络参数化"两层结构。

第一层是可微分的动力核（differentiable dynamical core）。 大气大尺度运动——气压、风场、温度的演变——本质上由流体力学方程支配，这套方程几十年来在传统 GCM 里被反复验证、足够可信。NeuralGCM 保留了这个传统流体动力学求解器，但把它写成"可微分"的形式。可微分意味着梯度能够穿过整个求解器反向传播，于是物理核和神经网络可以端到端一起训练，而不是各练各的、再硬拼起来。

第二层是神经网络参数化的次网格物理（subgrid physics）。 传统 GCM 最大的误差来源，往往不是大尺度动力学，而是那些尺度比网格还小的过程——云的生成、降水、对流、辐射传输。这些过程发生在毫米到公里量级，而模式网格通常是几十到上百公里，根本"看不清"，只能靠经验性的参数化方案近似，误差和不确定性主要堆积在这里。NeuralGCM 用神经网络替代这部分参数化，让模型从数据中学习次网格物理对大尺度的反馈。

训练数据上，NeuralGCM 同样以 ERA5 再分析数据集为真值。ERA5 是把卫星、地面站、探空等多源观测通过同化系统融合成的物理一致、时空连续的全球网格数据，被广泛视为历史气象的事实标准。模型在三种水平分辨率上训练：0.7°、1.4° 与 2.8°，对应不同的精度与算力取舍。评测时，团队把 NeuralGCM 与 ECMWF（欧洲中期天气预报中心）的集合预报系统 ECMWF-ENS、以及全球云分辨模式 X-SHiELD 等做了系统对比。

关键结论

把已核实的要点提炼出来，最值得记住的有这么几条：

1–15 天的集合预报，NeuralGCM 对标甚至超过 ECMWF-ENS。 在 1.4° 分辨率下，其集合预报在 5–15 天时段优于此前的最优模型；按论文口径，在 2–15 天预报中，约有 95% 的情形 NeuralGCM 的精度优于 ECMWF-ENS。需要强调，这是"集合预报技巧评分"层面的结论，且是在特定评测口径下成立。
算力成本相比传统高分辨率模式低数个量级。 在 1.4° 分辨率下，NeuralGCM 比全球云分辨模式 X-SHiELD 快约 3500 倍；整体算力开销约为 X-SHiELD 的 十万分之一，论文形容这相当于高性能计算领域约 25 年的进展。直观地说，X-SHiELD 模拟一年大气要约 20 天，NeuralGCM 只要约 8 分钟。
气候积分可稳定数十年。 在给定海表温度（SST）的条件下，NeuralGCM 能稳定追踪全球平均温度等气候指标数十年不发散。论文报告，在 1980–2020 共 40 年区间，2.8° 模型的温度预测误差约为传统纯大气模式的三分之一。
能再现合理的极端天气统计。 在 1.4° 分辨率（约 140 km）下，NeuralGCM 模拟出的热带气旋数量与强度，与 2020 年实际观测吻合较好。
明确的边界：论文作者坦言，NeuralGCM 不能外推到与训练气候差异很大的未来气候。也就是说，它擅长在历史气候统计范围内做高效模拟，但对剧烈偏离历史的未来情景仍需谨慎。

对新能源 / 运梦平台的意义

把这些结论落到风电、光伏与电网的实际工作流上，至少有三层意义。

第一，长期资源评估有了"又快又稳"的新参照。 风电选址、光伏长期发电量测算，本质上是在问"这片区域未来数十年的风、辐射统计特征如何"。NeuralGCM 证明：混合模式既能保持数十年积分的物理稳定，又把算力压到传统模式的极小一部分。这意味着此前只有大型科研机构才跑得起的长周期气候情景，正在变得更普惠——而它学习的范本，依然是新能源团队早已熟悉的 ERA5。ERA5 本身的来龙去脉可参考 ERA5 完全解读与 ERA5 产品页。

第二，"混合"思路对功率预测的工程启示。 NeuralGCM 没有推翻物理、也没有迷信黑箱，而是让二者各司其职：物理负责可信的大尺度骨架，机器学习负责难以精确建模的次网格细节。这恰恰是功率预测落地的好范式——用物理/气象驱动场打底，用数据驱动模型订正局地偏差。对风电功率预测和光伏功率预测而言，与其追求一个端到端黑箱，不如把可靠的气象输入和轻量订正模型组合起来。

第三，历史与预报的口径必须打通。 NeuralGCM 用 ERA5 训练，而业务里你还要和德国气象局这类预报源协同。新能源团队需要一套字段命名、单位、时空分辨率都一致的数据通道，避免"历史回测用一套字段、实时预报用另一套字段"反复换名。这正是双数据源平台的价值——历史用 ERA5，预报用德国气象局预报，字段口径统一。

在运梦气象 API 上手

南京运梦科技的运梦气象 API 同时提供 ERA5 与德国气象局等多个数据源，字段统一通过 downloadSync 接口按 dataSourceId 与 fields 拉取，刚好对应 NeuralGCM"历史训练 + 预报应用"两类需求。

按场景选字段的常用思路：

风资源 / 风电功率：u100、v100、ws、wd
光伏辐射 / 光伏功率：rsds、dni、dhi
常规气象 / 偏差订正：tas、hurs、sp、pr

如果你想复刻 NeuralGCM 的思路——拿 ERA5 长序列做模型训练或长周期回测，请求体大致是这样：

import os, requests

API = "https://console.yun-meng.top/api/energy-weather/search/weather/action/downloadSync"

payload = {
    "dataSourceId": "era5",                 # 历史训练真值，与 NeuralGCM 同源
    "lat": 31.5, "lon": 118.5,              # 风电 / 光伏场址单点
    "stime": "1980-01-01 00:00",
    "etime": "2020-12-31 23:00",            # 与论文 40 年气候区间对齐的长序列
    "fields": ["u100", "v100", "ws", "wd", "rsds", "tas"],
    "timezone": "8",
}

resp = requests.post(API, headers={"Authorization": f"Bearer {os.environ['YUNMENG_TOKEN']}"},
                     json=payload, timeout=600)
resp.raise_for_status()
result = resp.json()
if not result.get("success"):
    raise RuntimeError(result.get("msg", "查询失败"))

data = result["data"]
print(len(data["timeList"]), data["u100"][0], data["rsds"][0])

如果转向预报场景，只需把 dataSourceId 换成 ger，并把时间窗调整到未来时效即可。字段含义、单位与完整定义见数据要素解释，接口参数以 API 参考文档为准。两条产品线的详情分别见 ERA5 产品页与德国气象局预报。

一点工程提醒

NeuralGCM 的稳定，建立在一份干净、连续、口径一致的 ERA5 之上。落到工程上，无论你是训练自己的轻量订正模型，还是只做特征工程，先把历史气象数据的字段、单位、时区统一好，比急着上复杂模型更重要——这也是这篇论文给数据工程的隐性启示：可信的物理底座，永远是机器学习发挥价值的前提。

常见问题

NeuralGCM 和 GraphCast、Pangu-Weather 有什么区别？ GraphCast、Pangu-Weather 是纯数据驱动（黑箱）模型，主打未来约 10 天的中期天气预报；NeuralGCM 走混合（hybrid）路线，保留传统流体动力学求解器并写成可微分形式，再用神经网络替代次网格物理参数化，因此能稳定做数十年的气候积分。

NeuralGCM 真的比 ECMWF-ENS 更准吗？ 在特定评测口径下是的。按论文报告，1.4° 分辨率时其集合预报在 5–15 天时段优于此前最优模型，2–15 天预报中约 95% 的情形精度优于 ECMWF-ENS。这是"集合预报技巧评分"层面、在该评测口径下成立的结论。

NeuralGCM 用什么数据训练？我能用运梦气象 API 复刻吗？ NeuralGCM 以 ERA5 再分析数据集为训练真值，并在 0.7°、1.4°、2.8° 三种分辨率上训练。运梦气象 API 同样提供 ERA5 数据源，可通过 downloadSync 接口按 dataSourceId（如 era5）与 fields 拉取长序列做训练或长周期回测。

NeuralGCM 能用来预测几十年后的气候变化吗？ 要谨慎。论文作者明确指出 NeuralGCM 不能外推到与训练气候差异很大的未来气候；它擅长在历史气候统计范围内做高效模拟，对剧烈偏离历史的未来情景仍需谨慎对待。

混合模式思路对新能源功率预测有什么启示？ 让物理与机器学习各司其职：物理负责可信的大尺度骨架，数据驱动模型负责订正难以精确建模的局地偏差。落到风电、光伏功率预测上，与其追求端到端黑箱，不如用可靠的气象驱动场打底、叠加轻量订正模型。

引用与原文

Kochkov, D., Yuval, J., Langmore, I., Norgaard, P., Smith, J., Mooers, G., Klöwer, M., Lottes, J., Rasp, S., Düben, P., Hatfield, S., Battaglia, P., Sanchez-Gonzalez, A., Willson, M., Brenner, M. P., & Hoyer, S. (2024). Neural general circulation models for weather and climate. Nature, 632(8027), 1060–1066.

DOI：doi.org/10.1038/s41586-024-07744-y

预印本（arXiv 2311.07222）：arxiv.org/abs/2311.07222

相关阅读