气象数据

FengWu 风乌解读：把中期预报技巧推过 10 天

2024-06-16 · 南京运梦科技算法团队 · 评审算法负责人

风电中长期排产、光伏月度发电量滚动修正、电网跨周机组组合，这些活儿真正吃紧的地方从来不是"未来三天准不准"，而是"第 7 天到第 11 天还能不能当回事"。在这个时段，传统数值预报和早期 AI 模型都会被自回归滚动里的误差累积拖垮——初始的小偏差一步步放大，到了 10 天前后预报技巧迅速衰减，常常只剩气候态可用。2023 年由上海人工智能实验室等团队提出的 FengWu（风乌）正是冲着这条"10 天天花板"来的：它用一套多模态、多任务的设计，第一次把全球中期预报的有效技巧明确推过了 10 天时效。对需要把预报往延伸期靠的新能源团队来说，这是一篇值得逐条读懂的论文。

关键要点

FengWu（风乌）由上海人工智能实验室等团队于 2023 年提出（arXiv:2304.02948），首次以 ACC>0.6 为门槛，把 z500（500 hPa 位势（geopotential Φ））的有效预报时效推到约 10.75 天。
它的核心设计是三件套：把每个变量当一种「模态」配专属编解码器并用跨模态融合 Transformer 交互、用不确定性损失做区域自适应的多任务平衡、用回放缓冲专门改善中期时效的稳定性。
模型在 0.25° 网格、37 个垂直层上预测，训练数据为 39 年 ERA5 再分析；在论文统计的 880 个预报量中约 80% 优于 GraphCast，10 天 z500 的 RMSE 从约 733 降到约 651 m²/s²。
训练完成后推理极快，单步迭代在单张 NVIDIA A100 上约 600 毫秒量级，出报成本远低于传统数值模式。
落到新能源：延伸期（第 8–11 天）预报对风电、光伏、电网排产的参考价值实质提升；运梦气象 API 用 ERA5 做历史训练/回测、用德国气象局做预报，字段口径统一。

背景与定位

这篇论文的英文原题是 FengWu: Pushing the Skillful Global Medium-range Weather Forecast beyond 10 Days Lead，第一作者为 Kang Chen，合作者包括 Tao Han、Junchao Gong、Lei Bai 等共 14 位作者，出自上海人工智能实验室等机构，以预印本形式发表于 arXiv（2304.02948，2023 年 4 月）。

判断一篇文献的分量，通常看它解决了什么"前人没解决的问题"。在 FengWu 之前，以 GraphCast、Pangu-Weather 为代表的 AI 模型已经在 10 天时效、0.25° 分辨率上追平甚至超过了 ECMWF 的高分辨率确定性预报 HRES（背景可参考 GraphCast 解读）。但"10 天"几乎成了一道心理与技术上的天花板：再往后，z500 这类核心环流变量的距平相关系数（ACC）会掉到 0.6 以下，业界普遍把 ACC>0.6 当作"还算有技巧"的门槛。FengWu 的核心贡献，就是把这条线明确推过 10 天，并且给出了可量化的技巧增益。

方法 / 它做了什么

FengWu 的方法可以拆成三块来理解：多模态的建模视角、多任务的平衡机制、以及让中期段更稳的训练技巧。

多模态：把每个变量当一种"模态"

传统做法往往把几十个气象变量堆在一起、用一套共享网络硬学。FengWu 换了个视角——把不同的预报量（位势、温度、风、湿度等高空与地面变量）看作不同的模态，为每类变量配上专属的编码器与解码器（model-specific encoder-decoder），再用一个**跨模态融合 Transformer（cross-modal fusion Transformer）**把它们在共享的特征空间里交互融合。这样既保留了每个变量自己的统计特性，又让模型学到变量之间的物理耦合关系。它在 0.25° 经纬度网格、37 个垂直层上预测大气与地表状态，训练数据是 39 年的 ERA5 再分析。

多任务：用不确定性损失做区域自适应平衡

预报几十个变量、几十个气压层，本质是个多任务优化问题。难点在于：不同变量、不同区域的量纲与可预报性差异很大，简单加权很容易让某些任务主导训练、压垮另一些。FengWu 引入了不确定性损失（uncertainty loss），让模型在训练中自适应地、按区域调整各预报量的权重，避免顾此失彼。这是它能同时把大量变量都预报得"均衡好"的关键，而不是只在个别明星变量上刷分。

让中期段更稳：回放缓冲

自回归模型的通病是误差随步数累积。FengWu 引入了**回放缓冲（replay buffer）**机制：训练时把模型自己多步滚动产生的中间状态缓存下来、重新参与训练，相当于让模型提前"见过"自己长程预报时会遇到的偏差分布，从而专门改善中期时效的稳定性。正是这一步，让有效技巧得以从 10 天关口继续往后延伸。训练好的模型推理极快，单步迭代在单张 NVIDIA A100 上约需 600 毫秒量级，整条 10 天预报的出报成本远低于传统数值模式。

关键结论

把已核实的要点提炼出来，最值得记住的有这几条（数字均来自论文给定口径）：

首次把 z500 有效技巧推过 10 天。 以 ACC>0.6 作为"还算有技巧"的门槛，FengWu 把 500 hPa 位势（geopotential Φ） z500 的有效预报时效延伸到约 10.75 天，论文称这是首次把全球中期预报的可用技巧明确推过 10 天。需注意这是 z500 在该评测口径下的结论，并非每个变量都同步达到这个时效。
10 天时效的 z500 误差较 GraphCast 明显下降。 在 2018 年的回报（hindcast）测试中，10 天时效全球 z500 预报的均方根误差（RMSE）从约 733 降到约 651 m²/s²，相对前沿基准是实打实的收窄。
整体超越 GraphCast。 在论文统计的 880 个预报量（predictands，即变量×时效×层次的组合）中，FengWu 在约 80% 的项上优于 GraphCast——是"整体更优"，而非在每一项上都领先。
推理高效、成本低。 训练完成后，FengWu 出报只需前向计算，单步约 600 毫秒量级，无需每次都动用超级计算机求解物理方程，这是 AI 气象模型的共性优势。

要客观看待这些结论：所有"超过""推过 10 天"都是在论文给定的 ERA5 评测数据、特定变量与 ACC/RMSE 评分口径下成立；它衡量的是预报技巧评分，并不意味着传统数值预报被取代，二者更多是互补关系。

对新能源 / 运梦平台的意义

把这些结论落到风电、光伏、电网的实际工作流，至少有三层价值。

第一，延伸期预报开始变得"够得着"。 风电场的中长期检修排程、光伏电站的月度发电量滚动修正、电网的跨周机组组合，过去在第 8–11 天往往只能靠气候态兜底。FengWu 把 z500 这类环流核心变量的有效技巧推过 10 天，意味着延伸期预报对风电功率预测与光伏功率预测的参考价值实质性提升——当然，越往长时效越要结合概率区间使用，而不是当作确定值。

第二，再一次确认 ERA5 作为训练与回测底座的地位。 FengWu 和 GraphCast、FuXi 等前沿模型一样，把 ERA5 同时当作训练真值与评测标尺。这对做风资源、光伏资源评估的团队是个明确信号：你在选址、长期辐射统计、偏差订正里依赖的 ERA5 长序列，正是 AI 前沿模型眼中的标准答案。ERA5 的来龙去脉可参考 ERA5 产品页。

第三，"历史训练 + 预报应用"两套口径必须打通。 FengWu 用 ERA5 训练，业务上却要和实时预报源协同。新能源团队需要一套字段命名、单位、时空分辨率都一致的数据通道，避免历史回测一套字段、实时预报另一套字段反复换名。这正是双数据源平台的价值：历史用 ERA5，预报用德国气象局，字段口径统一。延伸期模型的相关思路也可对照 FuXi 级联模型解读。

在运梦气象 API 上手

南京运梦科技的运梦气象 API 同时提供 ERA5 与德国气象局双数据源，统一通过 downloadSync 接口按 dataSourceId 与 fields 拉取，刚好对应 FengWu"历史训练 + 预报应用"两类需求：历史回测用 era5，面向未来的预报用 ger（德国气象局）。

按场景选字段的常用思路：

风资源 / 风电功率：u100、v100、ws、wd
光伏辐射 / 光伏功率：rsds、dni、dhi
常规气象 / 偏差订正：tas、hurs、sp、pr

如果你想复刻 FengWu 的思路——拿 ERA5 长序列做模型训练或回测，请求体大致是这样：

POST /api/energy-weather/search/weather/action/downloadSync
{
  "dataSourceId": "era5",
  "lat": 31.5,
  "lon": 118.5,
  "stime": "1979-01-01 00:00",
  "etime": "2017-12-31 23:00",
  "fields": ["u100", "v100", "ws", "wd", "rsds", "tas"],
  "timezone": "8"
}

转向预报场景时，只需把 dataSourceId 换成 ger，并把时间窗调整到未来时效即可。字段含义、单位与完整定义见数据要素解释，接口参数以 API 参考文档为准。

一点工程提醒：FengWu 的多模态编码、不确定性损失、回放缓冲都建立在干净、连续、口径一致的 ERA5 之上。落到自己的业务里，无论你是训练轻量预测模型还是只做特征工程，先把历史气象数据的字段、单位、时区统一好，往往比急着上模型更重要——这也是这篇论文给数据工程的隐性启示。

常见问题

FengWu（风乌）能预报多少天？

以 ACC>0.6（业界常用的「还算有技巧」门槛）来衡量，FengWu 把 z500（500 hPa 位势（geopotential Φ））的有效预报时效推到约 10.75 天，首次把全球中期预报的可用技巧明确推过 10 天。需注意这是 z500 在该评测口径下的结论，并非每个变量都同步达到这个时效。

FengWu 和 GraphCast 比谁更强？

在论文统计的 880 个预报量（变量×时效×层次的组合）中，FengWu 在约 80% 的项上优于 GraphCast，10 天时效全球 z500 的 RMSE 从约 733 降到约 651 m²/s²。这是「整体更优」，并非每一项都领先。

FengWu 为什么能突破 10 天的预报天花板？

关键在三项设计：把每个变量当一种模态、配专属编解码器并用跨模态融合 Transformer 交互；用不确定性损失做区域自适应的多任务平衡；以及用回放缓冲把模型自己多步滚动的中间状态缓存重训，专门改善中期时效的稳定性。

FengWu 用什么数据训练？

它在 0.25° 经纬度网格、37 个垂直层上预测，训练数据是 39 年的 ERA5 再分析，并把 ERA5 同时当作训练真值与评测标尺。

AI 气象模型出来后，传统数值预报还有用吗？

论文里所有「超过」「推过 10 天」都是在给定的 ERA5 评测数据、特定变量与 ACC/RMSE 评分口径下成立，衡量的是预报技巧评分，并不意味着传统数值预报被取代，二者更多是互补关系。

引用与原文

Chen, K., Han, T., Gong, J., Bai, L., Ling, F., Luo, J.-J., Chen, X., Ma, L., Zhang, T., Su, R., Ci, Y., Li, B., Yang, X. & Ouyang, W. (2023). FengWu: Pushing the Skillful Global Medium-range Weather Forecast beyond 10 Days Lead. arXiv preprint.

预印本：arXiv:2304.02948

相关阅读