FourCastNet 解读:傅里叶神经算子的全球天气预报

做风电、光伏功率预测的人,对"算得慢"这件事大概都不陌生:一套高分辨率的物理数值预报,往往要在超级计算机上跑很久,普通团队既排不上队,也复现不起。2022 年 NVIDIA 团队放出的 FourCastNet,第一次让人直观地看到另一种可能——一个纯数据驱动的深度学习模型,可以在单卡上几秒钟内吐出一周的全球高分辨率预报,而且在不少变量上的技巧(skill)能逼近欧洲中期天气预报中心的业务系统。对天天和气象数据打交道的新能源从业者来说,这意味着"预报"这件事的成本结构正在被改写,集合预报、情景批量演算这些过去想都不敢想的玩法,开始变得触手可及。
关键要点
- FourCastNet(Pathak 等,arXiv:2202.11214,NVIDIA,2022)是一个纯数据驱动的全球高分辨率天气预报模型,核心结构是自适应傅里叶神经算子(AFNO)。
- AFNO 把空间信息混合搬到傅里叶频域,将复杂度从 Transformer 的平方级降到准线性 𝒪(N log N),同等规模下显存约 10GB(常规 ResNet 路线约需 83GB)。
- 模型在 0.25° 全球网格(721 × 1440 格点、约赤道 30km)上同时预测 20 个气象变量,一周预报可在不到 2 秒内生成。
- 以 ERA5 再分析(1979–2015、每 6 小时)为训练真值、初始场与评测标尺;在短时效大尺度变量上技巧可匹配 ECMWF IFS,降水在相应口径下甚至更优。
- 对新能源的价值在于低成本的集合/情景批量演算(支撑 P50/P90 概率预测),但需认清"匹配 IFS"的口径边界,宜作为物理预报的补充而非替换。
背景与定位
这篇论文的英文原题是 FourCastNet: A Global Data-driven High-resolution Weather Model using Adaptive Fourier Neural Operators,业界更习惯直接叫它的模型名 FourCastNet(Fourier Forecasting Neural Network 的缩写)。第一作者是 Jaideep Pathak、Shashank Subramanian 等人,出品方是 NVIDIA 联合多家高校的研究团队,2022 年 2 月以预印本形式发布在 arXiv 上,编号 arXiv:2202.11214。
判断一篇文献是否值得花时间,通常看三点:谁做的、做了什么、有没有可复现。这三点 FourCastNet 都站得很稳。它出自 NVIDIA 研究院,并把代码、数据说明与模型权重开源,能被独立复现和二次开发;更重要的是,它是这一波"AI 中期天气预报"浪潮里最早把高分辨率、全球网格、数据驱动三者同时跑通的代表作之一。在它之后才陆续出现的 GraphCast、Pangu-Weather 等模型,某种意义上都是在同一条赛道上接力——关于其中的图神经网络路线,可参考我们的 GraphCast 解读。
方法 / 它做了什么
FourCastNet 的核心是一种叫 自适应傅里叶神经算子(Adaptive Fourier Neural Operator,AFNO) 的网络结构。要理解它的巧妙之处,得先说清楚它想解决什么问题。
近几年的视觉模型里,Vision Transformer(ViT)靠"自注意力"机制让图像各个区块(token)彼此交换信息,效果很好,但代价是计算量随 token 数量呈平方级增长。全球 0.25° 网格展开后是 721 × 1440 个格点,token 数量极其庞大,直接套用标准 Transformer 在显存和算力上都吃不消——论文提到,同等规模下一个常规 ResNet 路线会需要约 83GB 显存,而 AFNO 只需约 10GB。
AFNO 的办法,是把"区块之间互相混合信息"这一步搬到傅里叶频域里去做。具体流程可以朴素地理解为三步:先用二维傅里叶变换把空间上的特征转换到频域;再在频域里用一个带"软阈值收缩"的小型多层感知机施加可学习的权重,相当于让模型自己学会保留有用的频率分量、压掉冗余的;最后做逆变换转回空间域,并叠加残差连接。这套基于傅里叶卷积的做法,把空间混合的复杂度从平方级降到了准线性的 𝒪(N log N) 量级,这正是它能在超高分辨率上跑得动的关键。
数据与驱动方式上,FourCastNet 走的是彻底的数据驱动路线:
- 训练真值:模型以 ERA5 再分析数据集为训练真值,使用 1979–2015 年的历史数据,按每 6 小时一个时刻(00、06、12、18 时)采样。ERA5 是把卫星、地面站、探空等多源观测通过同化系统融合成的物理一致、时空连续的全球网格数据,被广泛当作历史气象的事实标准。
- 建模变量:单个时刻被组织成一个形状为 721 × 1440 × 20 的张量,即在 0.25° 网格上同时预测 20 个气象变量,涵盖不同气压层的风速、温度、位势、相对湿度以及整层水汽等。
- 驱动方式:预测时以某一时刻的状态为输入,模型输出下一个 6 小时的状态,再把这个输出当作下一步的输入,自回归滚动一步步把预报推向未来。
评测同样以 ERA5 为基准,并把 FourCastNet 与 ECMWF 的业务数值预报系统 IFS 在多个变量、多个预报时效上系统对比。
关键结论
把论文中已核实的要点提炼出来,最值得记住的有这么几条:
- 空间分辨率 0.25°,约对应赤道附近 30km 网格,全球 721 × 1440 格点。这是与主流业务预报对齐的高分辨率,而非粗网格的"玩具模型"。
- 一周(约 7 天)的全球预报可在不到 2 秒内生成,相比依赖超算长时间排队运算的传统数值预报,是数量级上的效率跨越;论文进一步给出,在按"节点·秒"折算的口径下,其相对 IFS 的速度优势可达约 4.5 万倍(具体随折算口径与硬件而异)。
- 在短预报时效、大尺度变量上,FourCastNet 的预报技巧能匹配 ECMWF IFS;而在降水这类具有复杂细尺度结构的变量上,它在相应口径下甚至优于 IFS。需要强调"短时效""相应口径"这两个边界——以 500hPa 位势高度(Z500)为例,论文显示其在约 3 天内与 IFS 旗鼓相当,之后逐渐落后但仍能贴近到约 7 天,而非全程全面超越。
- 模型完全建立在 ERA5 之上:以 ERA5 训练、以 ERA5 初始场驱动、以 ERA5 为评测标尺。这条结论提醒我们——AI 气象模型的能力上限,与其训练数据 ERA5 的质量与覆盖高度绑定。
要客观地说,"匹配 IFS"指的是特定变量、特定时效下的技巧评分,并不意味着传统物理模式被取代;二者更多是互补关系,且数据驱动模型在极端事件、长时效上的稳健性仍需逐案验证。
对新能源 / 运梦平台的意义
把这些结论落到风电、光伏的实际工作流上,至少有三层意义。
第一,资源评估的数据底座被再次夯实。 FourCastNet 把 ERA5 作为唯一训练真值,等于又用一篇前沿论文确认了 ERA5 在全球历史气象数据中的基准地位。你在做风电场选址、光伏长期辐射评估时所依赖的那条 ERA5 长序列,正是 AI 前沿模型眼中的"标准答案",详见 ERA5 产品页。
第二,"快"打开了集合与情景演算的空间。 一周预报不到 2 秒,意味着用极低的成本就能跑出大量集合成员或多情景结果。对功率预测而言,这正好对上了行业的真实痛点:不再只要一条确定性曲线,而是要给出 P50/P90 这样的概率区间,用来支撑功率申报、备用安排与电力交易决策。AFNO 这类模型让"批量演算成本"从瓶颈变成了可承受的常规开销,落到风电场景可参考 风电功率预测。
第三,认清边界,别盲目替换。 FourCastNet 的强项在大尺度、短时效与高吞吐,但它"匹配 IFS"是有口径限定的,且对细粒度的局地阵风、复杂地形下的辐射衰减仍可能力有不逮。务实的做法是把数据驱动模型当作物理预报的补充与加速器:历史回测、资源评估用 ERA5 这类再分析底座打地基,实际短期功率预测再叠加业务预报源,而不是用单一模型包打天下。
在运梦气象 API 上手
在运梦气象 API 上,无论历史回测还是预报,都走同一个 downloadSync 接口,只需切换 dataSourceId:历史回测用 era5,预报用 ger(德国气象局)。下面是一个取风电功率预测常用要素的请求示例:
{
"dataSourceId": "ger",
"lat": 39.9,
"lon": 116.4,
"stime": "2026-01-08 00:00",
"etime": "2026-01-15 00:00",
"timezone": "8",
"fields": ["tas", "u100", "v100", "ws", "rsds"]
}
字段说明:dataSourceId 决定数据源(历史训练与回测改成 era5);lat/lon 为目标点经纬度;stime/etime 为起止时间;timezone 为必填的时区偏移;fields 选取所需要素,这里取了 2m 气温、100m 风的 u/v 分量、风速与地面短波辐射,分别对应风电与光伏的核心驱动变量。完整字段表见 数据要素说明,接口参数与鉴权见 API 参考文档。一句话原则:要复现 FourCastNet 这类模型所依赖的 ERA5 历史底座,就用 era5;要拿未来一周的预报驱动功率预测,就用 ger。
常见问题
FourCastNet 是什么?它和传统天气预报有什么不同? FourCastNet 是 NVIDIA 团队 2022 年发布的纯数据驱动深度学习天气预报模型(arXiv:2202.11214),核心是自适应傅里叶神经算子(AFNO)。与依赖超算长时间运算的传统物理数值预报不同,它能在单卡上几秒内生成一周的全球高分辨率预报。
FourCastNet 的预报精度能超过 ECMWF IFS 吗? 不能一概而论。论文显示它在短预报时效、大尺度变量上的技巧可匹配 ECMWF IFS,降水这类细尺度变量在相应口径下甚至更优;但以 500hPa 位势高度为例,约 3 天内与 IFS 旗鼓相当,之后逐渐落后。它与物理模式更多是互补关系,而非取代。
FourCastNet 用什么数据训练?分辨率是多少? 它以 ERA5 再分析数据集为训练真值,使用 1979–2015 年、每 6 小时一个时刻的历史数据,在 0.25° 全球网格(721 × 1440 格点、约赤道附近 30km)上同时预测 20 个气象变量。
FourCastNet 为什么能算得这么快? 关键在于 AFNO 把空间信息混合放到傅里叶频域处理,将复杂度从标准 Transformer 的平方级降到准线性的 𝒪(N log N) 量级;同等规模下显存仅约 10GB,而常规 ResNet 路线约需 83GB,因此能在超高分辨率上跑得动并实现一周预报不到 2 秒。
做风电光伏功率预测,怎么用运梦气象 API 复现这类模型的数据?
都走同一个 downloadSync 接口,只需切换 dataSourceId:历史回测与资源评估用 era5(即 FourCastNet 依赖的 ERA5 历史底座),未来一周预报驱动功率预测用 ger(德国气象局)。详见 API 参考文档。
引用与原文
- Pathak, J., Subramanian, S., Harrington, P., Raja, S., Chattopadhyay, A., Mardani, M., Kurth, T., Hall, D., Li, Z., Azizzadenesheli, K., Hassanzadeh, P., Kashinath, K., & Anandkumar, A. (2022). FourCastNet: A Global Data-driven High-resolution Weather Model using Adaptive Fourier Neural Operators. arXiv:2202.11214. https://arxiv.org/abs/2202.11214