气象数据

FourCastNet 解读：傅里叶神经算子的全球天气预报

2023-12-19 · 南京运梦科技算法团队 · 评审算法负责人

做风电、光伏功率预测的人，对"算得慢"这件事大概都不陌生：一套高分辨率的物理数值预报，往往要在超级计算机上跑很久，普通团队既排不上队，也复现不起。2022 年 NVIDIA 团队放出的 FourCastNet，第一次让人直观地看到另一种可能——一个纯数据驱动的深度学习模型，可以在单卡上几秒钟内吐出一周的全球高分辨率预报，而且在不少变量上的技巧（skill）能逼近欧洲中期天气预报中心的业务系统。对天天和气象数据打交道的新能源从业者来说，这意味着"预报"这件事的成本结构正在被改写，集合预报、情景批量演算这些过去想都不敢想的玩法，开始变得触手可及。

关键要点

FourCastNet（Pathak 等，arXiv:2202.11214，NVIDIA，2022）是一个纯数据驱动的全球高分辨率天气预报模型，核心结构是自适应傅里叶神经算子（AFNO）。
AFNO 把空间信息混合搬到傅里叶频域，将复杂度从 Transformer 的平方级降到准线性 𝒪(N log N)，同等规模下显存约 10GB（常规 ResNet 路线约需 83GB）。
模型在 0.25° 全球网格（721 × 1440 格点、约赤道 30km）上同时预测 20 个气象变量，一周预报可在不到 2 秒内生成。
以 ERA5 再分析（1979–2015、每 6 小时）为训练真值、初始场与评测标尺；在短时效大尺度变量上技巧可匹配 ECMWF IFS，降水在相应口径下甚至更优。
对新能源的价值在于低成本的集合/情景批量演算（支撑 P50/P90 概率预测），但需认清"匹配 IFS"的口径边界，宜作为物理预报的补充而非替换。

背景与定位

这篇论文的英文原题是 FourCastNet: A Global Data-driven High-resolution Weather Model using Adaptive Fourier Neural Operators，业界更习惯直接叫它的模型名 FourCastNet（Fourier Forecasting Neural Network 的缩写）。第一作者是 Jaideep Pathak、Shashank Subramanian 等人，出品方是 NVIDIA 联合多家高校的研究团队，2022 年 2 月以预印本形式发布在 arXiv 上，编号 arXiv:2202.11214。

判断一篇文献是否值得花时间，通常看三点：谁做的、做了什么、有没有可复现。这三点 FourCastNet 都站得很稳。它出自 NVIDIA 研究院，并把代码、数据说明与模型权重开源，能被独立复现和二次开发；更重要的是，它是这一波"AI 中期天气预报"浪潮里最早把高分辨率、全球网格、数据驱动三者同时跑通的代表作之一。在它之后才陆续出现的 GraphCast、Pangu-Weather 等模型，某种意义上都是在同一条赛道上接力——关于其中的图神经网络路线，可参考我们的 GraphCast 解读。

方法 / 它做了什么

FourCastNet 的核心是一种叫 自适应傅里叶神经算子（Adaptive Fourier Neural Operator，AFNO） 的网络结构。要理解它的巧妙之处，得先说清楚它想解决什么问题。

近几年的视觉模型里，Vision Transformer（ViT）靠"自注意力"机制让图像各个区块（token）彼此交换信息，效果很好，但代价是计算量随 token 数量呈平方级增长。全球 0.25° 网格展开后是 721 × 1440 个格点，token 数量极其庞大，直接套用标准 Transformer 在显存和算力上都吃不消——论文提到，同等规模下一个常规 ResNet 路线会需要约 83GB 显存，而 AFNO 只需约 10GB。

AFNO 的办法，是把"区块之间互相混合信息"这一步搬到傅里叶频域里去做。具体流程可以朴素地理解为三步：先用二维傅里叶变换把空间上的特征转换到频域；再在频域里用一个带"软阈值收缩"的小型多层感知机施加可学习的权重，相当于让模型自己学会保留有用的频率分量、压掉冗余的；最后做逆变换转回空间域，并叠加残差连接。这套基于傅里叶卷积的做法，把空间混合的复杂度从平方级降到了准线性的 𝒪(N log N) 量级，这正是它能在超高分辨率上跑得动的关键。

数据与驱动方式上，FourCastNet 走的是彻底的数据驱动路线：

训练真值：模型以 ERA5 再分析数据集为训练真值，使用 1979–2015 年的历史数据，按每 6 小时一个时刻（00、06、12、18 时）采样。ERA5 是把卫星、地面站、探空等多源观测通过同化系统融合成的物理一致、时空连续的全球网格数据，被广泛当作历史气象的事实标准。
建模变量：单个时刻被组织成一个形状为 721 × 1440 × 20 的张量，即在 0.25° 网格上同时预测 20 个气象变量，涵盖不同气压层的风速、温度、位势、相对湿度以及整层水汽等。
驱动方式：预测时以某一时刻的状态为输入，模型输出下一个 6 小时的状态，再把这个输出当作下一步的输入，自回归滚动一步步把预报推向未来。

评测同样以 ERA5 为基准，并把 FourCastNet 与 ECMWF 的业务数值预报系统 IFS 在多个变量、多个预报时效上系统对比。

关键结论

把论文中已核实的要点提炼出来，最值得记住的有这么几条：

空间分辨率 0.25°，约对应赤道附近 30km 网格，全球 721 × 1440 格点。这是与主流业务预报对齐的高分辨率，而非粗网格的"玩具模型"。
一周（约 7 天）的全球预报可在不到 2 秒内生成，相比依赖超算长时间排队运算的传统数值预报，是数量级上的效率跨越；论文进一步给出，在按"节点·秒"折算的口径下，其相对 IFS 的速度优势可达约 4.5 万倍（具体随折算口径与硬件而异）。
在短预报时效、大尺度变量上，FourCastNet 的预报技巧能匹配 ECMWF IFS；而在降水这类具有复杂细尺度结构的变量上，它在相应口径下甚至优于 IFS。需要强调"短时效""相应口径"这两个边界——以 500hPa 位势高度（Z500）为例，论文显示其在约 3 天内与 IFS 旗鼓相当，之后逐渐落后但仍能贴近到约 7 天，而非全程全面超越。
模型完全建立在 ERA5 之上：以 ERA5 训练、以 ERA5 初始场驱动、以 ERA5 为评测标尺。这条结论提醒我们——AI 气象模型的能力上限，与其训练数据 ERA5 的质量与覆盖高度绑定。

要客观地说，"匹配 IFS"指的是特定变量、特定时效下的技巧评分，并不意味着传统物理模式被取代；二者更多是互补关系，且数据驱动模型在极端事件、长时效上的稳健性仍需逐案验证。

对新能源 / 运梦平台的意义

把这些结论落到风电、光伏的实际工作流上，至少有三层意义。

第一，资源评估的数据底座被再次夯实。 FourCastNet 把 ERA5 作为唯一训练真值，等于又用一篇前沿论文确认了 ERA5 在全球历史气象数据中的基准地位。你在做风电场选址、光伏长期辐射评估时所依赖的那条 ERA5 长序列，正是 AI 前沿模型眼中的"标准答案"，详见 ERA5 产品页。

第二，"快"打开了集合与情景演算的空间。 一周预报不到 2 秒，意味着用极低的成本就能跑出大量集合成员或多情景结果。对功率预测而言，这正好对上了行业的真实痛点：不再只要一条确定性曲线，而是要给出 P50/P90 这样的概率区间，用来支撑功率申报、备用安排与电力交易决策。AFNO 这类模型让"批量演算成本"从瓶颈变成了可承受的常规开销，落到风电场景可参考风电功率预测。

第三，认清边界，别盲目替换。 FourCastNet 的强项在大尺度、短时效与高吞吐，但它"匹配 IFS"是有口径限定的，且对细粒度的局地阵风、复杂地形下的辐射衰减仍可能力有不逮。务实的做法是把数据驱动模型当作物理预报的补充与加速器：历史回测、资源评估用 ERA5 这类再分析底座打地基，实际短期功率预测再叠加业务预报源，而不是用单一模型包打天下。

在运梦气象 API 上手

在运梦气象 API 上，无论历史回测还是预报，都走同一个 downloadSync 接口，只需切换 dataSourceId：历史回测用 era5，预报用 ger（德国气象局）。下面是一个取风电功率预测常用要素的请求示例：

{
  "dataSourceId": "ger",
  "lat": 39.9,
  "lon": 116.4,
  "stime": "2026-01-08 00:00",
  "etime": "2026-01-15 00:00",
  "timezone": "8",
  "fields": ["tas", "u100", "v100", "ws", "rsds"]
}

字段说明：dataSourceId 决定数据源（历史训练与回测改成 era5）；lat/lon 为目标点经纬度；stime/etime 为起止时间；timezone 为必填的时区偏移；fields 选取所需要素，这里取了 2m 气温、100m 风的 u/v 分量、风速与地面短波辐射，分别对应风电与光伏的核心驱动变量。完整字段表见数据要素说明，接口参数与鉴权见 API 参考文档。一句话原则：要复现 FourCastNet 这类模型所依赖的 ERA5 历史底座，就用 era5；要拿未来一周的预报驱动功率预测，就用 ger。

常见问题

FourCastNet 是什么？它和传统天气预报有什么不同？ FourCastNet 是 NVIDIA 团队 2022 年发布的纯数据驱动深度学习天气预报模型（arXiv:2202.11214），核心是自适应傅里叶神经算子（AFNO）。与依赖超算长时间运算的传统物理数值预报不同，它能在单卡上几秒内生成一周的全球高分辨率预报。

FourCastNet 的预报精度能超过 ECMWF IFS 吗？ 不能一概而论。论文显示它在短预报时效、大尺度变量上的技巧可匹配 ECMWF IFS，降水这类细尺度变量在相应口径下甚至更优；但以 500hPa 位势高度为例，约 3 天内与 IFS 旗鼓相当，之后逐渐落后。它与物理模式更多是互补关系，而非取代。

FourCastNet 用什么数据训练？分辨率是多少？ 它以 ERA5 再分析数据集为训练真值，使用 1979–2015 年、每 6 小时一个时刻的历史数据，在 0.25° 全球网格（721 × 1440 格点、约赤道附近 30km）上同时预测 20 个气象变量。

FourCastNet 为什么能算得这么快？ 关键在于 AFNO 把空间信息混合放到傅里叶频域处理，将复杂度从标准 Transformer 的平方级降到准线性的 𝒪(N log N) 量级；同等规模下显存仅约 10GB，而常规 ResNet 路线约需 83GB，因此能在超高分辨率上跑得动并实现一周预报不到 2 秒。

做风电光伏功率预测，怎么用运梦气象 API 复现这类模型的数据？ 都走同一个 downloadSync 接口，只需切换 dataSourceId：历史回测与资源评估用 era5（即 FourCastNet 依赖的 ERA5 历史底座），未来一周预报驱动功率预测用 ger（德国气象局）。详见 API 参考文档。

引用与原文

Pathak, J., Subramanian, S., Harrington, P., Raja, S., Chattopadhyay, A., Mardani, M., Kurth, T., Hall, D., Li, Z., Azizzadenesheli, K., Hassanzadeh, P., Kashinath, K., & Anandkumar, A. (2022). FourCastNet: A Global Data-driven High-resolution Weather Model using Adaptive Fourier Neural Operators. arXiv:2202.11214. https://arxiv.org/abs/2202.11214

相关阅读