NeuralGCM 解读:物理与机器学习混合的气候模式

如果你做风电资源评估、光伏长期发电量测算,或者需要把未来几十年的气候情景纳入新能源资产的长期规划,那么 2024 年发表在 Nature 上的这篇 NeuralGCM,值得认真读一遍。过去两年的 AI 气象浪潮里,GraphCast、Pangu-Weather 这类纯数据驱动模型主打的是"中期天气预报"——管好未来 10 天。但新能源行业关心的远不止 10 天:你还要回答"这片海域未来三十年风资源会怎样变化""光伏电站全生命周期的辐射趋势是否被气候变化侵蚀"。这类跨越数十年的问题,传统上只能靠物理气候模式(GCM)回答,而它们极其昂贵。NeuralGCM 的价值,正是把机器学习的速度和物理模式的稳定性"缝"在了一起。
关键要点
- NeuralGCM 是 Google Research 2024 年发表于 Nature 正刊(632 卷 8027 期)的混合气候模式,核心是"可微分动力核 + 神经网络参数化",物理与机器学习可端到端一起训练。
- 在 1.4° 分辨率下,2–15 天预报中约 95% 的情形 NeuralGCM 精度优于 ECMWF-ENS(集合预报技巧评分口径)。
- 算力开销约为全球云分辨模式 X-SHiELD 的十万分之一,1.4° 下快约 3500 倍:X-SHiELD 模拟一年大气要约 20 天,NeuralGCM 只要约 8 分钟。
- 气候积分可稳定数十年;1980–2020 共 40 年区间,2.8° 模型温度误差约为传统纯大气模式的三分之一。
- 明确边界:NeuralGCM 不能外推到与训练气候差异很大的未来气候;它以 ERA5 再分析为训练真值,与运梦气象 API 历史数据源同源。
背景与定位
这篇论文的英文原题是 Neural general circulation models for weather and climate,业界用模型名称呼它:NeuralGCM。第一作者是 Dmitrii Kochkov 等人(Kochkov, Yuval, Langmore et al.),出品方是 Google Research,论文发表于 2024 年的 Nature 正刊,卷期为 632 卷 8027 期、页码 1060–1066。
判断一篇文献是否值得花时间,通常看发在哪、谁做的、解决什么真问题。NeuralGCM 三点都很硬。
- 期刊层级:Nature 是公认的顶级综合性期刊之一,气象与机器学习交叉成果能进正刊,门槛本身就是筛子。
- 出品方与可复现性:Google Research 在科学计算与深度学习领域积累深厚,NeuralGCM 的代码与权重已开源,可复现、可二次开发,影响力远超"只能看不能用"的论文。
- 范式定位:与 GraphCast 那类"纯黑箱"路线不同,NeuralGCM 是混合(hybrid)路线的代表作——它没有抛弃几十年沉淀的大气物理方程,而是用机器学习去补物理模式最薄弱的环节。这在追求长期可信度的气候模拟里,是一条更稳妥的技术路径。
方法 / 它做了什么
NeuralGCM 的核心思路,可以概括为"可微分动力核 + 神经网络参数化"两层结构。
第一层是可微分的动力核(differentiable dynamical core)。 大气大尺度运动——气压、风场、温度的演变——本质上由流体力学方程支配,这套方程几十年来在传统 GCM 里被反复验证、足够可信。NeuralGCM 保留了这个传统流体动力学求解器,但把它写成"可微分"的形式。可微分意味着梯度能够穿过整个求解器反向传播,于是物理核和神经网络可以端到端一起训练,而不是各练各的、再硬拼起来。
第二层是神经网络参数化的次网格物理(subgrid physics)。 传统 GCM 最大的误差来源,往往不是大尺度动力学,而是那些尺度比网格还小的过程——云的生成、降水、对流、辐射传输。这些过程发生在毫米到公里量级,而模式网格通常是几十到上百公里,根本"看不清",只能靠经验性的参数化方案近似,误差和不确定性主要堆积在这里。NeuralGCM 用神经网络替代这部分参数化,让模型从数据中学习次网格物理对大尺度的反馈。
训练数据上,NeuralGCM 同样以 ERA5 再分析数据集为真值。ERA5 是把卫星、地面站、探空等多源观测通过同化系统融合成的物理一致、时空连续的全球网格数据,被广泛视为历史气象的事实标准。模型在三种水平分辨率上训练:0.7°、1.4° 与 2.8°,对应不同的精度与算力取舍。评测时,团队把 NeuralGCM 与 ECMWF(欧洲中期天气预报中心)的集合预报系统 ECMWF-ENS、以及全球云分辨模式 X-SHiELD 等做了系统对比。
关键结论
把已核实的要点提炼出来,最值得记住的有这么几条:
- 1–15 天的集合预报,NeuralGCM 对标甚至超过 ECMWF-ENS。 在 1.4° 分辨率下,其集合预报在 5–15 天时段优于此前的最优模型;按论文口径,在 2–15 天预报中,约有 95% 的情形 NeuralGCM 的精度优于 ECMWF-ENS。需要强调,这是"集合预报技巧评分"层面的结论,且是在特定评测口径下成立。
- 算力成本相比传统高分辨率模式低数个量级。 在 1.4° 分辨率下,NeuralGCM 比全球云分辨模式 X-SHiELD 快约 3500 倍;整体算力开销约为 X-SHiELD 的 十万分之一,论文形容这相当于高性能计算领域约 25 年的进展。直观地说,X-SHiELD 模拟一年大气要约 20 天,NeuralGCM 只要约 8 分钟。
- 气候积分可稳定数十年。 在给定海表温度(SST)的条件下,NeuralGCM 能稳定追踪全球平均温度等气候指标数十年不发散。论文报告,在 1980–2020 共 40 年区间,2.8° 模型的温度预测误差约为传统纯大气模式的三分之一。
- 能再现合理的极端天气统计。 在 1.4° 分辨率(约 140 km)下,NeuralGCM 模拟出的热带气旋数量与强度,与 2020 年实际观测吻合较好。
- 明确的边界:论文作者坦言,NeuralGCM 不能外推到与训练气候差异很大的未来气候。也就是说,它擅长在历史气候统计范围内做高效模拟,但对剧烈偏离历史的未来情景仍需谨慎。
对新能源 / 运梦平台的意义
把这些结论落到风电、光伏与电网的实际工作流上,至少有三层意义。
第一,长期资源评估有了"又快又稳"的新参照。 风电选址、光伏长期发电量测算,本质上是在问"这片区域未来数十年的风、辐射统计特征如何"。NeuralGCM 证明:混合模式既能保持数十年积分的物理稳定,又把算力压到传统模式的极小一部分。这意味着此前只有大型科研机构才跑得起的长周期气候情景,正在变得更普惠——而它学习的范本,依然是新能源团队早已熟悉的 ERA5。ERA5 本身的来龙去脉可参考 ERA5 完全解读 与 ERA5 产品页。
第二,"混合"思路对功率预测的工程启示。 NeuralGCM 没有推翻物理、也没有迷信黑箱,而是让二者各司其职:物理负责可信的大尺度骨架,机器学习负责难以精确建模的次网格细节。这恰恰是功率预测落地的好范式——用物理/气象驱动场打底,用数据驱动模型订正局地偏差。对 风电功率预测 和 光伏功率预测 而言,与其追求一个端到端黑箱,不如把可靠的气象输入和轻量订正模型组合起来。
第三,历史与预报的口径必须打通。 NeuralGCM 用 ERA5 训练,而业务里你还要和德国气象局这类预报源协同。新能源团队需要一套字段命名、单位、时空分辨率都一致的数据通道,避免"历史回测用一套字段、实时预报用另一套字段"反复换名。这正是双数据源平台的价值——历史用 ERA5,预报用 德国气象局预报,字段口径统一。
在运梦气象 API 上手
南京运梦科技的运梦气象 API 同时提供 ERA5 与德国气象局等多个数据源,字段统一通过 downloadSync 接口按 dataSourceId 与 fields 拉取,刚好对应 NeuralGCM"历史训练 + 预报应用"两类需求。
按场景选字段的常用思路:
- 风资源 / 风电功率:
u100、v100、ws、wd - 光伏辐射 / 光伏功率:
rsds、dni、dhi - 常规气象 / 偏差订正:
tas、hurs、sp、pr
如果你想复刻 NeuralGCM 的思路——拿 ERA5 长序列做模型训练或长周期回测,请求体大致是这样:
import os, requests
API = "https://console.yun-meng.top/api/energy-weather/search/weather/action/downloadSync"
payload = {
"dataSourceId": "era5", # 历史训练真值,与 NeuralGCM 同源
"lat": 31.5, "lon": 118.5, # 风电 / 光伏场址单点
"stime": "1980-01-01 00:00",
"etime": "2020-12-31 23:00", # 与论文 40 年气候区间对齐的长序列
"fields": ["u100", "v100", "ws", "wd", "rsds", "tas"],
"timezone": "8",
}
resp = requests.post(API, headers={"Authorization": f"Bearer {os.environ['YUNMENG_TOKEN']}"},
json=payload, timeout=600)
resp.raise_for_status()
result = resp.json()
if not result.get("success"):
raise RuntimeError(result.get("msg", "查询失败"))
data = result["data"]
print(len(data["timeList"]), data["u100"][0], data["rsds"][0])
如果转向预报场景,只需把 dataSourceId 换成 ger,并把时间窗调整到未来时效即可。字段含义、单位与完整定义见 数据要素解释,接口参数以 API 参考文档 为准。两条产品线的详情分别见 ERA5 产品页 与 德国气象局预报。
一点工程提醒
NeuralGCM 的稳定,建立在一份干净、连续、口径一致的 ERA5 之上。落到工程上,无论你是训练自己的轻量订正模型,还是只做特征工程,先把历史气象数据的字段、单位、时区统一好,比急着上复杂模型更重要——这也是这篇论文给数据工程的隐性启示:可信的物理底座,永远是机器学习发挥价值的前提。
常见问题
NeuralGCM 和 GraphCast、Pangu-Weather 有什么区别? GraphCast、Pangu-Weather 是纯数据驱动(黑箱)模型,主打未来约 10 天的中期天气预报;NeuralGCM 走混合(hybrid)路线,保留传统流体动力学求解器并写成可微分形式,再用神经网络替代次网格物理参数化,因此能稳定做数十年的气候积分。
NeuralGCM 真的比 ECMWF-ENS 更准吗? 在特定评测口径下是的。按论文报告,1.4° 分辨率时其集合预报在 5–15 天时段优于此前最优模型,2–15 天预报中约 95% 的情形精度优于 ECMWF-ENS。这是"集合预报技巧评分"层面、在该评测口径下成立的结论。
NeuralGCM 用什么数据训练?我能用运梦气象 API 复刻吗?
NeuralGCM 以 ERA5 再分析数据集为训练真值,并在 0.7°、1.4°、2.8° 三种分辨率上训练。运梦气象 API 同样提供 ERA5 数据源,可通过 downloadSync 接口按 dataSourceId(如 era5)与 fields 拉取长序列做训练或长周期回测。
NeuralGCM 能用来预测几十年后的气候变化吗? 要谨慎。论文作者明确指出 NeuralGCM 不能外推到与训练气候差异很大的未来气候;它擅长在历史气候统计范围内做高效模拟,对剧烈偏离历史的未来情景仍需谨慎对待。
混合模式思路对新能源功率预测有什么启示? 让物理与机器学习各司其职:物理负责可信的大尺度骨架,数据驱动模型负责订正难以精确建模的局地偏差。落到风电、光伏功率预测上,与其追求端到端黑箱,不如用可靠的气象驱动场打底、叠加轻量订正模型。
引用与原文
Kochkov, D., Yuval, J., Langmore, I., Norgaard, P., Smith, J., Mooers, G., Klöwer, M., Lottes, J., Rasp, S., Düben, P., Hatfield, S., Battaglia, P., Sanchez-Gonzalez, A., Willson, M., Brenner, M. P., & Hoyer, S. (2024). Neural general circulation models for weather and climate. Nature, 632(8027), 1060–1066.
DOI:doi.org/10.1038/s41586-024-07744-y
预印本(arXiv 2311.07222):arxiv.org/abs/2311.07222