气象数据

FuXi 解读:级联机器学习把全球预报推到 15 天

· 南京运梦科技算法团队 · 评审 算法负责人

FuXi 解读:级联机器学习把全球预报推到 15 天 封面

做风电中长期排产、光伏月度发电量预估,或者电网侧的检修窗口安排时,最让人头疼的往往不是"未来三天准不准",而是"第 10 天到第 15 天还能不能信"。传统数值预报和早期 AI 模型在这个时段都会被误差累积拖垮——一步步自回归滚动下去,初始的小偏差被不断放大,到了两周时效几乎只剩气候态。2023 年发表在 npj Climate and Atmospheric Science 上的 FuXi(伏羲)正是冲着这个痛点来的:它用一套"级联"思路,把单一模型在短中长不同时效上的矛盾拆开处理,第一次让一个机器学习系统在 15 天全球预报上做到了与 ECMWF 集合均值相当的水平。对需要把预报往两周时效延伸的新能源团队来说,这是一篇值得逐条读懂的论文。

关键要点

  • FuXi(复旦团队,npj Climate and Atmospheric Science 2023,文章号 190)是首个在 15 天全球预报上整体比肩 ECMWF 集合均值的机器学习系统。
  • 核心设计是"级联接力":FuXi-Short(0–5 天)、FuXi-Medium(5–10 天)、FuXi-Long(10–15 天)三个子模型串联,专门压制长程误差累积。
  • 单模型为 U-Transformer 结构,48 个 Swin Transformer V2 模块,预测 70 个通道、0.25° 经纬度网格(721×1440 格点)、6 小时步长。
  • 训练数据是 39 年 6 小时 ERA5 再分析(1979–2015);有效时效上 T2M(2m 气温)从约 10 天延伸到约 14.5 天,Z500 从约 9.25 天延伸到约 10.5 天。
  • 落到新能源场景:历史回测用 ERA5、面向未来的预报用德国气象局,运梦气象 API 通过 downloadSyncdataSourceId 统一字段口径拉取,对应"历史训练 + 预报应用"两类需求。

背景与定位

这篇论文的英文原题是 FuXi: a cascade machine learning forecasting system for 15-day global weather forecast,作者为 Lei Chen、Xiaohui Zhong、Feng Zhang、Yuan Cheng、Yinghui Xu、Yuan Qi、Hao Li,出自复旦大学相关团队,发表于 npj Climate and Atmospheric Science(2023,第 6 卷,文章号 190),对应预印本 arXiv:2306.12873。

判断一篇文献的分量,通常看它解决了什么"前人没解决的问题"。在 FuXi 之前,以 GraphCast、Pangu-Weather 为代表的 AI 模型已经在 10 天时效、0.25° 分辨率上超过了 ECMWF 的高分辨率确定性预报 HRES(详见 GraphCast 解读)。但要在 15 天时效上比肩 ECMWF 的集合均值(Ensemble Mean, EM)——一个把几十个扰动成员平均、专门用来压制长程不确定性的强基准——此前还没有 AI 模型做到。FuXi 的核心贡献,就是把这条线推到了 15 天,并且是用一套结构清晰、可复现的方法做到的。

方法 / 它做了什么

FuXi 的方法可以拆成三层来理解:单模型的骨架、级联的拆解策略、以及数据与扰动。

骨架:U-Transformer

单个 FuXi 模型是一套 U-Transformer 结构。输入先经过一个"立方体嵌入(cube embedding)"——本质是一个 3D 卷积,把高维的大气状态压缩成更紧凑的特征图;中间主干由 48 个 Swin Transformer V2 模块堆叠,配合类似 U-Net 的下采样、上采样与跳跃连接,让模型既能捕捉全球大尺度环流,又能保留局地细节。它预测的状态量共 70 个通道:5 个高空变量(位势 Z、温度 T、纬向风 U、经向风 V、相对湿度 R)各覆盖 13 个气压层(合计 65 个),再加上 5 个地面变量(2m 气温、10m 风的 u/v 分量、海平面气压、降水)。空间上是 0.25° 经纬度网格,721×1440 格点,时间步长 6 小时

级联:短 / 中 / 长三段接力

这是 FuXi 名字里"cascade"的由来,也是全文最关键的设计。自回归滚动预报有个内在矛盾:针对短时效优化的模型,到了长时效误差累积更快;而针对长时效优化又会牺牲短时效精度。FuXi 的做法是训练三个专精不同窗口的子模型,像接力赛一样串起来

  • FuXi-Short:负责 0–5 天(第 0–20 步);
  • FuXi-Medium:负责 5–10 天(第 21–40 步);
  • FuXi-Long:负责 10–15 天(第 41–60 步)。

每个子模型都从前一段的权重初始化、再在自己负责的时效窗口上微调。预报时,前一段的输出作为后一段的输入逐段交棒,最终拼出覆盖 15 天、共 60 个 6 小时步的完整预报。这种"分段专精 + 接力"的结构,正是它压制长程误差累积、把有效时效延伸到两周的关键。

数据与集合

训练数据是 39 年的 6 小时 ERA5 再分析(1979–2015),以 2016–2017 年作验证、2018 年作独立测试。在确定性预报之外,FuXi 还通过扰动初始条件与模型参数构造集合预报,用来表达预报的不确定性——这一步是它能和"集合均值"这类基准对话的前提。

关键结论

把已核实的要点提炼出来,最值得记住的有这几条(数字均来自论文测试集口径):

  • 15 天时效上比肩 ECMWF 集合均值。 以纬度加权 RMSE 和距平相关系数(ACC)衡量,FuXi 的整体预报技巧在 15 天时效上可与 ECMWF EM 相当,被论文称为首个达到该水平的机器学习系统。需要注意,这是"整体相当",并非在每个变量、每个时效上都更优。
  • 有效预报时效(ACC>0.6)被明显拉长。 以 ACC 超过 0.6 作为"还算有技巧"的门槛:500 hPa 位势高度 Z500 的有效时效从 HRES 的约 9.25 天延伸到约 10.5 天;2m 气温 T2M 从约 10 天延伸到约 14.5 天。后者的提升尤其显著。
  • 集合表现与 ECMWF 集合在前段贴近。 在约 9 天时效以内,FuXi 集合在 Z500、T850、海平面气压(MSL)、T2M 等变量上与 ECMWF 集合表现相当——这意味着它不仅确定性预报能打,概率化的不确定性刻画也站得住。
  • 效率沿袭 AI 模型的共性优势。 与依赖超级计算机求解物理方程的传统集合相比,训练好的 FuXi 无需求解物理方程,在单张 GPU 上数十秒内即可完成 60 步自回归滚动、出 15 天报,出报成本远低于超算集合。

要客观看待这些结论:所有"比肩""超过"都是在论文给定的 2018 年测试集、特定变量与评分口径下成立;它衡量的是预报技巧评分,并不意味着传统数值集合被取代,二者更多是互补关系。

对新能源 / 运梦平台的意义

把这些结论落到风电、光伏、电网的实际工作流,至少有三层价值。

第一,两周时效的预报开始变得"可用"。 风电场的中长期检修排程、光伏电站的月度发电量滚动修正、电网的跨周机组组合,过去在第 10–15 天往往只能靠气候态兜底。FuXi 把 T2M 这类变量的有效时效推到接近两周,意味着延伸期预报对 风电功率预测光伏功率预测 的参考价值实质性提升——当然,越往长时效越要结合概率区间使用,而非当作确定值。

第二,再一次确认 ERA5 作为训练与回测底座的地位。 FuXi 和它的前辈一样,把 ERA5 同时当作训练真值与评测标尺。这对做风资源、光伏资源评估的团队是个明确信号:你做选址、长期辐射统计、偏差订正时依赖的 ERA5 长序列,正是 AI 前沿模型眼中的标准答案。关于 ERA5 的来龙去脉可参考 ERA5 产品页

第三,"历史训练 + 预报应用"两套口径必须打通。 级联模型用 ERA5 训练,业务上却要和实时预报源协同。新能源团队需要一套字段命名、单位、时空分辨率都一致的数据通道,避免历史回测一套字段、实时预报另一套字段反复换名。这正是双数据源平台的价值:历史用 ERA5,预报用 德国气象局预报,字段口径统一。

在运梦气象 API 上手

南京运梦科技的运梦气象 API 同时提供 ERA5德国气象局双数据源,统一通过 downloadSync 接口按 dataSourceIdfields 拉取,刚好对应 FuXi"历史训练 + 预报应用"两类需求:历史回测用 era5,面向未来的预报用 ger(德国气象局)。

按场景选字段的常用思路:

  • 风资源 / 风电功率:u100v100wswd
  • 光伏辐射 / 光伏功率:rsdsdnidhi
  • 常规气象 / 偏差订正:tashurssppr

如果你想复刻 FuXi 的思路——拿 ERA5 长序列做模型训练或回测,请求体大致是这样:

POST /api/energy-weather/search/weather/action/downloadSync
{
  "dataSourceId": "era5",
  "lat": 31.5,
  "lon": 118.5,
  "stime": "1979-01-01 00:00",
  "etime": "2015-12-31 23:00",
  "fields": ["u100", "v100", "ws", "wd", "rsds", "tas"],
  "timezone": "8"
}

转向预报场景时,只需把 dataSourceId 换成 ger,并把时间窗调整到未来时效即可。字段含义、单位与完整定义见 数据要素解释,接口参数以 API 参考文档 为准。

一点工程提醒:FuXi 之所以能把级联接力跑顺,前提是输入的 ERA5 干净、连续、口径一致。落到自己的业务里,无论你是训练轻量预测模型还是只做特征工程,先把历史气象数据的字段、单位、时区统一好,往往比急着上模型更重要——这也是这篇论文给数据工程的隐性启示。

常见问题

FuXi 能把天气预报做到多少天? FuXi 在 15 天全球预报上的整体预报技巧(以纬度加权 RMSE 和距平相关系数 ACC 衡量)可与 ECMWF 集合均值相当,是论文称的首个达到该水平的机器学习系统。

FuXi 为什么叫"级联(cascade)"模型? 因为它训练了三个专精不同时效窗口的子模型——FuXi-Short(0–5 天)、FuXi-Medium(5–10 天)、FuXi-Long(10–15 天)——像接力赛一样逐段交棒,用"分段专精 + 接力"压制自回归滚动中的长程误差累积。

FuXi 和 GraphCast、Pangu-Weather 有什么区别? GraphCast、Pangu-Weather 已在 10 天时效、0.25° 分辨率上超过 ECMWF 高分辨率确定性预报 HRES;FuXi 的核心贡献是把这条线推到 15 天,并首次在该时效上比肩 ECMWF 的集合均值这一压制长程不确定性的强基准。

FuXi 用什么数据训练? 训练数据是 39 年的 6 小时 ERA5 再分析(1979–2015),以 2016–2017 年作验证、2018 年作独立测试,所有"比肩""超过"的结论都在 2018 年测试集、特定变量与评分口径下成立。

在运梦气象 API 上如何复刻 FuXi 的历史训练 + 预报应用思路? 历史回测用 era5、面向未来的预报用德国气象局(ger),统一通过 downloadSync 接口按 dataSourceIdfields 拉取,字段、单位、时区口径一致,无需在历史与实时两套字段间反复换名。

引用与原文

Chen, L., Zhong, X., Zhang, F., Cheng, Y., Xu, Y., Qi, Y. & Li, H. (2023). FuXi: a cascade machine learning forecasting system for 15-day global weather forecast. npj Climate and Atmospheric Science, 6, 190.

DOI:doi.org/10.1038/s41612-023-00512-1 | 预印本:arXiv:2306.12873