气象数据

FengWu 风乌解读:把中期预报技巧推过 10 天

· 南京运梦科技算法团队 · 评审 算法负责人

FengWu 风乌解读:把中期预报技巧推过 10 天 封面

风电中长期排产、光伏月度发电量滚动修正、电网跨周机组组合,这些活儿真正吃紧的地方从来不是"未来三天准不准",而是"第 7 天到第 11 天还能不能当回事"。在这个时段,传统数值预报和早期 AI 模型都会被自回归滚动里的误差累积拖垮——初始的小偏差一步步放大,到了 10 天前后预报技巧迅速衰减,常常只剩气候态可用。2023 年由上海人工智能实验室等团队提出的 FengWu(风乌)正是冲着这条"10 天天花板"来的:它用一套多模态、多任务的设计,第一次把全球中期预报的有效技巧明确推过了 10 天时效。对需要把预报往延伸期靠的新能源团队来说,这是一篇值得逐条读懂的论文。

关键要点

  • FengWu(风乌)由上海人工智能实验室等团队于 2023 年提出(arXiv:2304.02948),首次以 ACC>0.6 为门槛,把 z500(500 hPa 位势(geopotential Φ))的有效预报时效推到约 10.75 天。
  • 它的核心设计是三件套:把每个变量当一种「模态」配专属编解码器并用跨模态融合 Transformer 交互、用不确定性损失做区域自适应的多任务平衡、用回放缓冲专门改善中期时效的稳定性。
  • 模型在 0.25° 网格、37 个垂直层上预测,训练数据为 39 年 ERA5 再分析;在论文统计的 880 个预报量中约 80% 优于 GraphCast,10 天 z500 的 RMSE 从约 733 降到约 651 m²/s²。
  • 训练完成后推理极快,单步迭代在单张 NVIDIA A100 上约 600 毫秒量级,出报成本远低于传统数值模式。
  • 落到新能源:延伸期(第 8–11 天)预报对风电、光伏、电网排产的参考价值实质提升;运梦气象 API 用 ERA5 做历史训练/回测、用德国气象局做预报,字段口径统一。

背景与定位

这篇论文的英文原题是 FengWu: Pushing the Skillful Global Medium-range Weather Forecast beyond 10 Days Lead,第一作者为 Kang Chen,合作者包括 Tao Han、Junchao Gong、Lei Bai 等共 14 位作者,出自上海人工智能实验室等机构,以预印本形式发表于 arXiv(2304.02948,2023 年 4 月)

判断一篇文献的分量,通常看它解决了什么"前人没解决的问题"。在 FengWu 之前,以 GraphCast、Pangu-Weather 为代表的 AI 模型已经在 10 天时效、0.25° 分辨率上追平甚至超过了 ECMWF 的高分辨率确定性预报 HRES(背景可参考 GraphCast 解读)。但"10 天"几乎成了一道心理与技术上的天花板:再往后,z500 这类核心环流变量的距平相关系数(ACC)会掉到 0.6 以下,业界普遍把 ACC>0.6 当作"还算有技巧"的门槛。FengWu 的核心贡献,就是把这条线明确推过 10 天,并且给出了可量化的技巧增益。

方法 / 它做了什么

FengWu 的方法可以拆成三块来理解:多模态的建模视角、多任务的平衡机制、以及让中期段更稳的训练技巧。

多模态:把每个变量当一种"模态"

传统做法往往把几十个气象变量堆在一起、用一套共享网络硬学。FengWu 换了个视角——把不同的预报量(位势、温度、风、湿度等高空与地面变量)看作不同的模态,为每类变量配上专属的编码器与解码器(model-specific encoder-decoder),再用一个**跨模态融合 Transformer(cross-modal fusion Transformer)**把它们在共享的特征空间里交互融合。这样既保留了每个变量自己的统计特性,又让模型学到变量之间的物理耦合关系。它在 0.25° 经纬度网格、37 个垂直层上预测大气与地表状态,训练数据是 39 年的 ERA5 再分析

多任务:用不确定性损失做区域自适应平衡

预报几十个变量、几十个气压层,本质是个多任务优化问题。难点在于:不同变量、不同区域的量纲与可预报性差异很大,简单加权很容易让某些任务主导训练、压垮另一些。FengWu 引入了不确定性损失(uncertainty loss),让模型在训练中自适应地、按区域调整各预报量的权重,避免顾此失彼。这是它能同时把大量变量都预报得"均衡好"的关键,而不是只在个别明星变量上刷分。

让中期段更稳:回放缓冲

自回归模型的通病是误差随步数累积。FengWu 引入了**回放缓冲(replay buffer)**机制:训练时把模型自己多步滚动产生的中间状态缓存下来、重新参与训练,相当于让模型提前"见过"自己长程预报时会遇到的偏差分布,从而专门改善中期时效的稳定性。正是这一步,让有效技巧得以从 10 天关口继续往后延伸。训练好的模型推理极快,单步迭代在单张 NVIDIA A100 上约需 600 毫秒量级,整条 10 天预报的出报成本远低于传统数值模式。

关键结论

把已核实的要点提炼出来,最值得记住的有这几条(数字均来自论文给定口径):

  • 首次把 z500 有效技巧推过 10 天。 以 ACC>0.6 作为"还算有技巧"的门槛,FengWu 把 500 hPa 位势(geopotential Φ) z500 的有效预报时效延伸到约 10.75 天,论文称这是首次把全球中期预报的可用技巧明确推过 10 天。需注意这是 z500 在该评测口径下的结论,并非每个变量都同步达到这个时效。
  • 10 天时效的 z500 误差较 GraphCast 明显下降。 在 2018 年的回报(hindcast)测试中,10 天时效全球 z500 预报的均方根误差(RMSE)从约 733 降到约 651 m²/s²,相对前沿基准是实打实的收窄。
  • 整体超越 GraphCast。 在论文统计的 880 个预报量(predictands,即变量×时效×层次的组合)中,FengWu 在约 80% 的项上优于 GraphCast——是"整体更优",而非在每一项上都领先。
  • 推理高效、成本低。 训练完成后,FengWu 出报只需前向计算,单步约 600 毫秒量级,无需每次都动用超级计算机求解物理方程,这是 AI 气象模型的共性优势。

要客观看待这些结论:所有"超过""推过 10 天"都是在论文给定的 ERA5 评测数据、特定变量与 ACC/RMSE 评分口径下成立;它衡量的是预报技巧评分,并不意味着传统数值预报被取代,二者更多是互补关系。

对新能源 / 运梦平台的意义

把这些结论落到风电、光伏、电网的实际工作流,至少有三层价值。

第一,延伸期预报开始变得"够得着"。 风电场的中长期检修排程、光伏电站的月度发电量滚动修正、电网的跨周机组组合,过去在第 8–11 天往往只能靠气候态兜底。FengWu 把 z500 这类环流核心变量的有效技巧推过 10 天,意味着延伸期预报对 风电功率预测光伏功率预测 的参考价值实质性提升——当然,越往长时效越要结合概率区间使用,而不是当作确定值。

第二,再一次确认 ERA5 作为训练与回测底座的地位。 FengWu 和 GraphCast、FuXi 等前沿模型一样,把 ERA5 同时当作训练真值与评测标尺。这对做风资源、光伏资源评估的团队是个明确信号:你在选址、长期辐射统计、偏差订正里依赖的 ERA5 长序列,正是 AI 前沿模型眼中的标准答案。ERA5 的来龙去脉可参考 ERA5 产品页

第三,"历史训练 + 预报应用"两套口径必须打通。 FengWu 用 ERA5 训练,业务上却要和实时预报源协同。新能源团队需要一套字段命名、单位、时空分辨率都一致的数据通道,避免历史回测一套字段、实时预报另一套字段反复换名。这正是双数据源平台的价值:历史用 ERA5,预报用德国气象局,字段口径统一。延伸期模型的相关思路也可对照 FuXi 级联模型解读

在运梦气象 API 上手

南京运梦科技的运梦气象 API 同时提供 ERA5德国气象局双数据源,统一通过 downloadSync 接口按 dataSourceIdfields 拉取,刚好对应 FengWu"历史训练 + 预报应用"两类需求:历史回测用 era5,面向未来的预报用 ger(德国气象局)。

按场景选字段的常用思路:

  • 风资源 / 风电功率:u100v100wswd
  • 光伏辐射 / 光伏功率:rsdsdnidhi
  • 常规气象 / 偏差订正:tashurssppr

如果你想复刻 FengWu 的思路——拿 ERA5 长序列做模型训练或回测,请求体大致是这样:

POST /api/energy-weather/search/weather/action/downloadSync
{
  "dataSourceId": "era5",
  "lat": 31.5,
  "lon": 118.5,
  "stime": "1979-01-01 00:00",
  "etime": "2017-12-31 23:00",
  "fields": ["u100", "v100", "ws", "wd", "rsds", "tas"],
  "timezone": "8"
}

转向预报场景时,只需把 dataSourceId 换成 ger,并把时间窗调整到未来时效即可。字段含义、单位与完整定义见 数据要素解释,接口参数以 API 参考文档 为准。

一点工程提醒:FengWu 的多模态编码、不确定性损失、回放缓冲都建立在干净、连续、口径一致的 ERA5 之上。落到自己的业务里,无论你是训练轻量预测模型还是只做特征工程,先把历史气象数据的字段、单位、时区统一好,往往比急着上模型更重要——这也是这篇论文给数据工程的隐性启示。

常见问题

FengWu(风乌)能预报多少天?

以 ACC>0.6(业界常用的「还算有技巧」门槛)来衡量,FengWu 把 z500(500 hPa 位势(geopotential Φ))的有效预报时效推到约 10.75 天,首次把全球中期预报的可用技巧明确推过 10 天。需注意这是 z500 在该评测口径下的结论,并非每个变量都同步达到这个时效。

FengWu 和 GraphCast 比谁更强?

在论文统计的 880 个预报量(变量×时效×层次的组合)中,FengWu 在约 80% 的项上优于 GraphCast,10 天时效全球 z500 的 RMSE 从约 733 降到约 651 m²/s²。这是「整体更优」,并非每一项都领先。

FengWu 为什么能突破 10 天的预报天花板?

关键在三项设计:把每个变量当一种模态、配专属编解码器并用跨模态融合 Transformer 交互;用不确定性损失做区域自适应的多任务平衡;以及用回放缓冲把模型自己多步滚动的中间状态缓存重训,专门改善中期时效的稳定性。

FengWu 用什么数据训练?

它在 0.25° 经纬度网格、37 个垂直层上预测,训练数据是 39 年的 ERA5 再分析,并把 ERA5 同时当作训练真值与评测标尺。

AI 气象模型出来后,传统数值预报还有用吗?

论文里所有「超过」「推过 10 天」都是在给定的 ERA5 评测数据、特定变量与 ACC/RMSE 评分口径下成立,衡量的是预报技巧评分,并不意味着传统数值预报被取代,二者更多是互补关系。

引用与原文

Chen, K., Han, T., Gong, J., Bai, L., Ling, F., Luo, J.-J., Chen, X., Ma, L., Zhang, T., Su, R., Ci, Y., Li, B., Yang, X. & Ouyang, W. (2023). FengWu: Pushing the Skillful Global Medium-range Weather Forecast beyond 10 Days Lead. arXiv preprint.

预印本:arXiv:2304.02948