ECMWF AIFS 解读:业务级数据驱动预报系统

如果你做风电、光伏功率预测,过去两年最该盯紧的一件事,是 AI 天气预报模型从"论文里跑得很好"走到了"真的接管业务运行"。在这条路上,欧洲中期天气预报中心(ECMWF)的 AIFS 是一个标志性节点:它不是又一个开源 demo,而是一个由全球顶级业务预报机构亲手研发、并已正式投入日常业务出图的数据驱动系统。对每天靠气象驱动场喂模型的新能源团队来说,这意味着上游气象输入的"生产方式"正在发生根本变化——更快、更省、且在多项指标上不输传统物理模式。读懂 AIFS,等于提前看清未来几年功率预测气象底座的样子。
关键要点
- AIFS 是 ECMWF 自研的数据驱动预报系统(arXiv:2406.01465),采用 GNN 编码器/解码器加滑动窗口 Transformer 处理器架构,训练真值来自 ERA5 再分析。
- 确定性版 AIFS Single v1 已于 2025 年 2 月 25 日业务化,网格间距约 28 km,单次出图能耗约为物理模式 IFS 的 1/1000。
- 集合版 AIFS ENS 于 2025 年 7 月 1 日业务化,由 51 个成员组成、分辨率约 31 km,生成速度比物理模式快 10 倍以上。
- ECMWF 公开口径下 AIFS 在许多指标上追平甚至反超物理模式,部分项目(确定性版热带气旋路径、集合版地表温度)最高约有 20% 增益。
- 对新能源团队的实操意义:历史回测用 ERA5、预报应用接德国气象局,字段口径统一,即可对应 AIFS"历史训练 + 预报应用"两类需求。
背景与定位
这篇论文的英文原题是 AIFS – ECMWF's data-driven forecasting system,对应预印本 arXiv:2406.01465,第一作者为 Simon Lang,共 16 位作者,出品方正是 ECMWF 本身,首次提交于 2024 年 6 月。AIFS 是 Artificial Intelligence Forecasting System(人工智能预报系统)的缩写。
判断一篇文献的分量,通常看出品方、是否落地、是否可复现。AIFS 三点都立得住:
- 出品方权威:ECMWF 是公认的全球中期数值预报标杆机构,其传统物理模式 IFS(Integrated Forecasting System)长期被视为业务预报的金标准。由这样一家机构自己下场做数据驱动模型,份量与一篇纯学术论文不可同日而语。
- 真正业务化:AIFS 不停留在论文阶段。其确定性版本 AIFS Single v1 已于 2025 年 2 月 25 日正式投入业务运行,与物理模式 IFS 并行出图;这是它区别于多数 AI 气象研究的关键。
- 持续演进且开放:模型权重在 Hugging Face 公开,并在 2026 年 5 月 12 日随 IFS Cycle 50r1 一同升级至 AIFS v2,新增了数据驱动的海浪与积雪覆盖分量。一个还在快速迭代、且对外开放的系统,工程可用性远高于"只能看不能用"的成果。
方法 / 它做了什么
AIFS 的核心是一套深度学习架构,论文把它拆成三块:图神经网络(GNN)编码器与解码器,加上中间的滑动窗口 Transformer 处理器。直观理解是这样的——
- 编码器把规则的全球经纬网格数据,映射到一张更适合神经网络处理的图结构上;
- 处理器用滑动窗口 Transformer 在这张图上学习大气状态如何随时间演变,窗口机制让它既能捕捉局地细节,又能控制算力开销;
- 解码器再把结果映射回经纬网格,输出我们熟悉的格点预报场。
在数据上,AIFS 走的是彻底的数据驱动路线:训练真值来自 ERA5 再分析与 ECMWF 的业务分析场。ERA5 把卫星、地面站、探空等多源观测,通过同化系统融合成物理一致、时空连续的全球网格数据,是历史气象的事实标准。预测时,模型以分析场为起点自回归滚动——把上一步输出当作下一步输入,逐步把预报推向未来。
值得单独说的是它的集合(ensemble)版本 AIFS ENS。配套论文 AIFS-CRPS 提出用"近似公平的连续分级概率评分(afCRPS)"作为损失函数直接训练集合模型,使模型本身具备随机性、可生成任意数量的成员,从而以一次训练得到校准良好的概率预报,而非靠事后扰动拼凑。这正是新能源最关心的"不确定性"来源。
关键结论
把已核实的要点提炼出来,最值得记住的有这么几条:
- 确定性版 AIFS Single 已业务运行:2025 年 2 月 25 日上线,网格间距约 28 km;相比 IFS 全球约 9 km 的物理模式,分辨率更粗,但出图所需的能耗约降至其 1/1000。这是"省"的一面。
- 集合版 AIFS ENS 同样业务化:2025 年 7 月 1 日上线,由 51 个成员组成,分辨率约 31 km,生成速度比物理模式快 10 倍以上。
- 多项指标追平甚至反超物理模式:ECMWF 公开口径下,AIFS 在许多指标上不逊于业界顶尖物理模式,部分项目最高有约 20% 的增益——确定性版在热带气旋路径上、集合版在地表温度上,都给出了这一量级的提升。
- v2 拓展了要素覆盖:2026 年 5 月 12 日升级的 AIFS v2,为 Single 与 ENS 都引入海浪与积雪覆盖分量,新增约 11 个海浪相关变量,且海浪中期技巧较物理模式有明显改善。
需要给结论加边界:上述"最高 20%"是 ECMWF 在特定变量、特定评测口径下的表述,并非对所有变量、所有时效的普遍承诺;AIFS 分辨率仍粗于 IFS,在高分辨率场与耦合地球系统过程上,物理模式依然不可替代。二者是互补而非取代关系。
对新能源 / 运梦平台的意义
把这些结论落到风电、光伏的实际工作流上,至少有三层意义。
第一,上游气象输入的成本结构被改写。 AIFS 把单次出图能耗压到物理模式的千分之一量级、速度提升十倍以上,意味着更高频、更密集的预报刷新成为可能。对 风电功率预测 与 光伏功率预测 而言,更快的气象驱动场更新,有利于缩短预测链路的时延、支撑更频繁的滚动预报。
第二,集合预报让"不确定性"变得可直接量化。 AIFS ENS 以 51 个成员、且用 CRPS 类损失直接训练,输出的是校准较好的概率分布。新能源最缺的恰恰是"区间"而非"单点"——P50/P90 出力分布、备用容量测算、电力市场报价的风险敞口,都依赖可信的成员离散度。集合化的数据驱动预报,正好对上这个需求。
第三,历史与预报的字段口径必须打通。 AIFS 用 ERA5 训练、又在业务中和德国气象局这类预报源协同,新能源团队就需要一套字段命名、单位、时空分辨率一致的数据通道,避免"历史回测一套字段、实时预报另一套字段"的反复换名。这正是双数据源平台的价值——历史回测用 ERA5,预报应用接 德国气象局预报,字段口径统一。关于同为数据驱动路线的姊妹模型,可对照阅读 GraphCast 解读。
在运梦气象 API 上手
南京运梦科技的运梦气象 API 同时提供 ERA5 与德国气象局双数据源,字段统一通过 downloadSync 接口按 dataSourceId 与 fields 拉取,刚好对应 AIFS"历史训练 + 预报应用"两类需求。
按场景选字段的常用思路:
- 风资源 / 风电功率:
u100、v100、ws、wd - 光伏辐射 / 光伏功率:
rsds、dni、dhi - 常规气象 / 偏差订正:
tas、hurs、sp、pr
如果你想用 ERA5 长序列做模型训练或回测——这正是 AIFS 的训练范式——请求体大致是这样:
import os, requests
API = "https://console.yun-meng.top/api/energy-weather/search/weather/action/downloadSync"
payload = {
"dataSourceId": "era5", # 历史训练真值,与 AIFS 同源
"lat": 31.5, "lon": 118.5, # 风电 / 光伏场址单点
"stime": "2015-01-01 00:00",
"etime": "2024-12-31 23:00", # 多年历史,供回测与特征工程
"fields": ["u100", "v100", "ws", "wd", "rsds", "tas"],
"timezone": "8",
}
resp = requests.post(API, headers={"Authorization": f"Bearer {os.environ['YUNMENG_TOKEN']}"},
json=payload, timeout=600)
resp.raise_for_status()
result = resp.json()
if not result.get("success"):
raise RuntimeError(result.get("msg", "查询失败"))
data = result["data"]
print(len(data["timeList"]), data["u100"][0], data["rsds"][0])
如果转向预报场景,只需把 dataSourceId 换成 ger(德国气象局),并把时间窗调整到未来时效即可。字段含义、单位与完整定义见 数据要素解释,接口参数以 API 参考文档 为准。
一点工程提醒
AIFS 能做到"低能耗、高频刷新",前提仍是一份干净、连续、口径一致的历史数据作为训练与评测基准。落到工程上,无论你是训练轻量预测模型,还是只做特征工程,先把历史气象数据的字段、单位、时区统一好,比急着上模型更重要——这也是 ECMWF 选择 ERA5 作为训练真值给数据工程的隐性启示。
常见问题
AIFS 是什么?它和 ECMWF 的 IFS 有什么区别? AIFS(Artificial Intelligence Forecasting System)是 ECMWF 自研的数据驱动预报系统,用深度学习从 ERA5 再分析中学习大气演变;IFS 则是 ECMWF 的传统物理模式。AIFS 出图更快、能耗更低,IFS 分辨率更高,二者并行出图、互补而非取代。
AIFS 已经正式业务化了吗? 是的。确定性版 AIFS Single v1 于 2025 年 2 月 25 日投入业务运行,集合版 AIFS ENS 于 2025 年 7 月 1 日业务化,2026 年 5 月 12 日随 IFS Cycle 50r1 升级至 AIFS v2。
AIFS 的预报精度比传统物理模式更好吗? 在 ECMWF 公开口径下,AIFS 在许多指标上不逊于业界顶尖物理模式,部分项目最高约有 20% 增益(确定性版体现在热带气旋路径、集合版体现在地表温度)。但该数字是特定变量、特定评测口径下的表述,并非对所有变量、所有时效的普遍承诺。
AIFS 对风电、光伏功率预测有什么用? AIFS 把单次出图能耗压到物理模式的千分之一量级、速度提升十倍以上,支持更高频的预报刷新;其集合版以 51 个成员、CRPS 类损失直接训练,输出校准较好的概率分布,正好对应新能源 P50/P90 出力分布、备用容量测算等对不确定性区间的需求。
在运梦气象 API 上如何复现 AIFS 的"历史训练 + 预报应用"两类需求?
运梦气象 API 同时提供 ERA5 与德国气象局双数据源,通过 downloadSync 接口按 dataSourceId 与 fields 拉取:历史回测用 era5,预报应用把 dataSourceId 换成 ger 并将时间窗调整到未来时效即可,字段口径统一。
引用与原文
Lang, S., Alexe, M., Chantry, M., et al. (2024). AIFS – ECMWF's data-driven forecasting system. arXiv preprint. DOI:doi.org/10.48550/arXiv.2406.01465(arXiv:2406.01465)
Lang, S., Alexe, M., Clare, M. C. A., et al. (2026). AIFS-CRPS: ensemble forecasting using a model trained with a loss function based on the continuous ranked probability score. npj Artificial Intelligence. DOI:doi.org/10.1038/s44387-026-00073-7(预印本 arXiv:2412.15832)