气象数据

AI 气象大模型如何落地新能源功率预测

· 南京运梦科技算法团队 · 评审 算法负责人

AI 气象大模型如何落地新能源功率预测 封面

如果你在新能源行业做风电选址、光伏功率预测或电网调度,过去三年最值得追的一条主线,就是 AI 气象大模型从"论文跑分"一路走到"接管业务出图"。它们的意义对功率预测从业者尤其直接:风光出力本质上是气象驱动场的函数,预报的好坏先天受限于上游天气输入的质量与时效。当一类纯数据驱动的模型能在一分钟内输出未来十天的全球预报、并在多数指标上追平甚至超过运行了几十年的物理数值预报系统时,功率预测赖以立身的"气象底座"就被重新定义了。本文把 GraphCast、Pangu-Weather、FourCastNet、FengWu、AIFS 这几篇代表性工作的核实事实摆清楚,再讲清它们能怎样、又不能怎样地接入风光功率预测。

关键要点

  • GraphCast、Pangu-Weather、FourCastNet、FengWu、AIFS 五大 AI 中期预报模型共享同一训练范本——ECMWF 的 ERA5 再分析数据。
  • GraphCast 单次推理一分钟内输出未来 10 天、0.25° 全球预报,在 1380 个验证目标中约 90% 指标优于当时最准的业务确定性系统(按其论文口径)。
  • AIFS 是这组里唯一已正式业务化的系统:确定性版 1.0.0 于 2025 年 2 月 25 日上线、1.1.0 于 2025 年 8 月 27 日接替,相对前代整体技巧提升约 4%–6%。
  • FengWu 把"有技巧的"全球中期预报(z500 的 ACC > 0.6)延伸到约 10.75 天;FourCastNet 生成一周预报不到 2 秒。
  • 务实路径是把 AI 模型当作"更好的上游气象驱动场",再叠加本地化偏差订正与功率建模,而非指望它一步到位输出场站发电量。

背景与定位

这一波 AI 中期预报浪潮,可以用五篇文献串起来,它们共同的训练范本都是 ECMWF 的 ERA5 再分析数据:

  • GraphCast,英文原题 Learning skillful medium-range global weather forecasting,Lam 等人,发表于 Science 2023 年(vol. 382, 1416–1421)。它是 AI 中期预报的起点性文献之一。
  • Pangu-Weather,原题 Accurate medium-range global weather forecasting with 3D neural networks,Bi 等人,发表于 Nature 2023 年(vol. 619, 533–538),由华为云团队完成。
  • FourCastNet,原题 FourCastNet: A Global Data-driven High-resolution Weather Model using Adaptive Fourier Neural Operators,Pathak 等人,2022 年预印本(arXiv:2202.11214),由 NVIDIA 等机构主导,是把傅里叶神经算子用于全球预报的早期标杆。
  • FengWu,原题 FengWu: Pushing the Skillful Global Medium-range Weather Forecast beyond 10 Days Lead,Chen 等人,2023 年预印本(arXiv:2304.02948),来自上海人工智能实验室等团队。
  • AIFS,ECMWF 自研的数据驱动业务系统,其升级版 AIFS Single 1.1.0 论文发表于 Geoscientific Model Development 2026 年(vol. 19, 4703–4724)。

判断这一组工作的分量,看出品方、发表层级与是否落地:Science、Nature、GMD 都是各自领域的顶刊;出品方覆盖 Google DeepMind、华为云、NVIDIA、上海人工智能实验室与 ECMWF;而 AIFS 已经真正进入业务运行——这是它区别于多数"只能看不能用"研究成果的关键。

方法 / 它们做了什么

这几个模型机制各异,但共享同一套工程逻辑:以 ERA5 历史再分析为训练真值,学习"从当前大气状态推演下一时刻"的映射,再以自回归方式滚动把预报推向未来。区别在于它们各自用了什么网络结构来表达"全球天气彼此关联"这件事。

  • GraphCast 用图神经网络(GNN),把全球大气组织成图上的节点与连边,让信息在不同空间位置之间传递,天然契合"各地天气相互影响"的物理事实。
  • Pangu-Weather 用三维地球特定 Transformer(3D Earth-Specific Transformer),把高度作为独立维度建模,从而捕捉不同气压层之间的关系;它还用"分层时间聚合"策略缓解长程预报的误差累积。
  • FourCastNet 用自适应傅里叶神经算子(AFNO),在频域上高效处理高分辨率场,对风速、降水、大气可降水量这类细尺度变量尤其擅长。
  • FengWu 从多模态、多任务视角切入,用带专属编解码器与跨模态融合 Transformer 的结构,并在不确定性损失下训练,目标是把"有技巧的预报"推得更远。
  • AIFS 用 GNN 编解码器加滑窗 Transformer 处理器,训练数据同时包含 ERA5 与 ECMWF 业务分析;它是这组里唯一已正式业务化的系统。

对工程师而言,关键不在于谁的网络更花哨,而在于:这些模型把"算一次全球预报"的成本从超算小时级压到了普通 GPU 的分秒级,让高频、多情景的气象驱动场第一次变得"用得起"。

关键结论

下面几条均为联网核实后的具体数字,并按其评测口径标注边界,不作绝对化推断。

  1. GraphCast:在 0.25° 全球分辨率上输出未来 10 天、覆盖数百个变量的预报,单次推理"一分钟内"完成;在 1380 个验证目标中,约 90% 的指标优于当时最准的业务确定性系统(按其论文评测口径)。
  2. Pangu-Weather:基于 39 年全球数据训练,在再分析数据上对所有测试变量取得比 ECMWF 业务 IFS 更强的确定性结果;初始化于再分析时,热带气旋路径追踪精度也高于 ECMWF-HRES(限其论文测试条件)。
  3. FourCastNet:在 0.25° 分辨率上,短时效大尺度变量可匹配 ECMWF-IFS,而在降水等细尺度结构变量上更优;生成一周预报"不到 2 秒",比 IFS 快数个量级。
  4. FengWu:首次把"有技巧的"全球中期预报(以 z500 的距平相关系数 ACC > 0.6 为界)延伸到约 10.75 天 时效。
  5. AIFS(1.1.0):约 0.25° 分辨率、6 小时步长;AIFS Single 1.1.0 于 2025 年 8 月 27 日业务化(其前代 1.0.0 于 2025 年 2 月 25 日上线,1.1.0 主要修正了降水预报问题)。相对 1.0.0,高空与近地面变量整体技巧提升约 4%–6%,降水按分类技巧度量提升最高约 12%、约 1 天提前量。需要强调:这些"超越"多在特定变量、特定时效与特定评分口径下成立,并非全场景一律领先。

对新能源 / 运梦平台的意义

把上面的事实映射到风电、光伏、电网与功率预测,可以这样理解 AI 气象模型的价值与边界。

  • 风电:轮毂高度风速对出力高度敏感。AI 模型把"快速产出多套全球风场"变得廉价,便于做多情景、多初始时刻的集合化驱动,再用功率曲线映射为出力,提升日前与短期预测的稳健性。
  • 光伏:辐照、云量、温度是出力主因。FourCastNet 这类对细尺度变量更敏感的模型,配合实测发电数据做后处理,有助于改善日前辐照预报;但云的短临演变仍需专门的临近预报手段补足。
  • 电网与调度:更快、更省的预报让"按需重算"成为可能——电力市场报价、备用安排、储能调度都能用上更高频更新的气象输入。
  • 共同边界:AI 模型学的是历史再分析的统计规律,对训练分布外的极端事件、对场站级微地形与局地效应,仍有系统性偏差。把它当作"更好的上游驱动场",再叠加本地化偏差订正与功率建模,才是务实路径,而非指望它一步到位输出场站发电量。

在运梦气象 API 上手

运梦气象 API 通过 downloadSync 接口,按 dataSourceIdfields 拉取某点、某时间段的变量。历史回测用 era5;上线预报把 dataSourceId 换成 ger(德国气象局预报源)即可复用同一套字段与代码框架;如需交叉验证,可替换为 nasazg1

下面是一个面向光伏功率预测的最小请求示例,历史回测阶段拉取辐照、温度与风的小时级序列:

{
  "dataSourceId": "era5",
  "lat": 38.47,
  "lon": 106.27,
  "stime": "2024-01-01 00:00",
  "etime": "2024-12-31 23:00",
  "fields": ["rsds", "tas", "u100", "v100"],
  "timezone": "8"
}

拿到整年序列后,可按本文思路推进:先用 era5 做长周期回测、训练并标定本地化偏差订正;上线时把 dataSourceId 切到 ger 复用同一管线产出滚动预报。字段口径与单位以官方文档为准:完整字段表见 /docs/weather/data-elements/,接口参数见 /docs/weather/api-reference/,ERA5 数据源说明见 /products/weather-api/era5/,风电功率预测能力见 /products/wind-forecast/

常见问题

AI 气象大模型能直接预测风电光伏的发电量吗? 不能一步到位。AI 模型学的是历史再分析的统计规律,对训练分布外的极端事件、对场站级微地形与局地效应仍有系统性偏差。务实做法是把它当作"更好的上游气象驱动场",再叠加本地化偏差订正与功率建模。

GraphCast、Pangu-Weather、FourCastNet、FengWu、AIFS 这几个模型有什么共同点? 它们共享同一套工程逻辑:以 ERA5 历史再分析为训练真值,学习"从当前大气状态推演下一时刻"的映射,再以自回归方式滚动把预报推向未来;区别主要在各自采用的网络结构。

这些 AI 气象模型里哪个已经真正业务化运行? AIFS 是这组里唯一已正式业务化的系统,由 ECMWF 自研:确定性版 1.0.0 于 2025 年 2 月 25 日上线、升级版 1.1.0 于 2025 年 8 月 27 日接替;这是它区别于多数"只能看不能用"研究成果的关键。

AI 气象模型比传统数值预报快多少? 快数个量级。GraphCast 单次推理在一分钟内完成未来 10 天的全球预报,FourCastNet 生成一周预报不到 2 秒——它们把"算一次全球预报"的成本从超算小时级压到了普通 GPU 的分秒级。

用运梦气象 API 做功率预测,历史回测和上线预报该选哪个数据源? 历史回测用 era5,上线预报把 dataSourceId 换成 ger(德国气象局预报源)即可复用同一套字段与代码框架;如需交叉验证,可替换为 nasazg1

引用与原文