气象大数据

AI 气象降尺度:超分辨率方法与传统降尺度对比

· 南京运梦科技算法团队 · 评审 算法负责人

AI 气象降尺度:超分辨率方法与传统降尺度对比 封面

做风电、光伏资源评估和功率预测的人,几乎天天和一个矛盾打交道:全球再分析和业务预报的水平分辨率往往在十几到几十公里量级,而真正决定一台风机、一片光伏阵列出力的,是公里乃至百米尺度的山脊加速、谷地通道、海陆风、城市热岛与云团边界。把粗网格的值直接插值到机位上,山脊低估、谷地高估、辐射峰值被抹平几乎是必然。过去弥合这道鸿沟的标准答案有两条——动力降尺度(用 WRF 这类中尺度模式重新求解物理方程)和统计降尺度(拟合粗网格与局地观测的统计关系)。最近几年,深度学习把计算机视觉里的"图像超分辨率"思路搬进气象领域,催生了第三条路线:AI 气象降尺度(super-resolution downscaling)。本文把这三条路线放在同一张桌子上对比,讲清 AI 超分辨率到底强在哪、弱在哪,又该怎样落到新能源工程里。

关键要点

  • AI 气象降尺度把粗网格场当作"低分辨率图像",用 SRCNN、GAN、扩散模型等超分辨率网络学习从粗到细的映射,推理只需一次前向、毫秒到秒级,远快于动力降尺度的数值积分。
  • 它的本质仍是统计降尺度的一种——学的是相关关系而非物理方程,因此继承了统计方法的根本边界:训练分布外(新地形、极端环流、未来气候)的泛化没有保证。
  • 相比传统线性/分位数统计降尺度,AI 超分辨率的增益主要在于空间结构:卷积/注意力机制能重建出局地地形纹理与锐利的场边界,而不只是逐点订正。
  • 确定性 AI 降尺度(如 MSE 训练的 CNN)会因"回归到均值"而抹平极端与小尺度方差;GAN 与扩散模型通过生成式建模恢复真实的功率谱与极端尾部,但需警惕"看着真、物理却不守恒"的幻觉。
  • 三条路线不是互斥的:务实做法是用动力或 AI 降尺度得到物理一致或结构逼真的高分背景场,再叠加分位数映射等偏差订正与实测校验,并以多源交叉验证量化不确定性。

三条降尺度路线先理清

在谈 AI 之前,先把"降尺度"这件事的坐标系摆正。所谓降尺度,就是把一个低分辨率(粗网格)的气象场,转换成与之物理/统计一致的高分辨率场。主流有三族方法。

动力降尺度(dynamical downscaling)。 用 WRF 这类中尺度数值模式,把粗网格场作为初始与侧边界条件,在小区域内逐网格点重新积分大气运动方程。它的精细结构不是插出来的,而是模式根据真实地形重新算出来的——山脊抬升、背风分离、谷地急流这些插值永远变不出的结构,它能在物理上重建。代价是算力极重:一场高分辨率年尺度模拟往往要在集群上跑很久,普通团队既排不上队也复现不起。关于这条路线的工具、嵌套与"灰区"局限,可参见姊妹篇 /blog/wrf-dynamical-downscaling/

统计降尺度(statistical downscaling)。 不解物理方程,而是用历史数据拟合"粗网格预报因子 → 局地观测量"的统计关系,再把这关系套到新数据上。经典做法包括多元回归、类比法、加权插值,以及面向分布订正的分位数映射(quantile mapping)。它轻量、快,但有两条死穴:一是依赖足够长、足够代表性的局地观测来训练;二是隐含平稳性假设——历史拟合出的关系在外推(新气候、新区域)时未必成立。

AI 超分辨率降尺度。 这是本文主角,可以看成统计降尺度的"深度学习升级版"。它把粗网格场当作低分辨率图像、把目标高分场当作高分辨率图像,用计算机视觉里的超分辨率网络去学这个从粗到细的映射。理解它的关键,是先认清它本质上仍属于统计降尺度——只不过把人工设计的回归换成了表达力强得多的神经网络。

AI 超分辨率到底在做什么

计算机视觉里的"单图超分辨率",是把一张模糊小图还原成清晰大图。把这个范式迁移到气象,就得到了 AI 气象降尺度的核心套路:输入一张低分辨率的气象场(如 25 公里风速、温度、辐射),输出一张高分辨率场(如 3 公里或 1 公里),训练目标是让输出尽量贴近高分辨率的"真值"——通常用高分辨率再分析、雷达、卫星或动力降尺度产物充当标签。 沿着模型族谱,常见有三类。

SRCNN 一类的确定性卷积网络。 最朴素的做法:堆几层卷积,端到端学低分到高分的映射,损失函数用逐像素的均方误差(MSE)或 MAE。它简单、稳定,对平滑场的逐点精度往往不错。但有一个致命的统计学副作用——回归到均值:当一个低分输入对应多种可能的高分细节时,最小化 MSE 的最优解是输出所有可能性的平均,结果就是把小尺度方差和极端值系统性地抹平。表现出来就是场过于"糊"、功率谱在高波数段塌陷、大风和辐射峰值被削平。这对关心爬坡事件、限功率触发点的功率预测是硬伤。

GAN 一类的生成对抗网络。 为了对抗"糊",引入一个判别器去逼真度打分,迫使生成器输出在统计上"看起来像真的"高分场。GAN 类方法(气象领域有学者把这条思路称作对抗式超分辨率降尺度)能恢复出锐利的纹理与接近真实的小尺度功率谱,极端尾部也保留得更好。代价是训练不稳定、可能产生physically implausible 的细节(即"幻觉"——看着像云像锋面,物理上却站不住),且不保证质量、动量等守恒量。

扩散模型一类的生成式方法。 近两年的新方向,把降尺度视为条件生成:以粗网格场为条件,从噪声出发逐步去噪生成高分场。它能产出一组而非单一高分样本,天然给出条件分布——这对刻画"同一粗网格输入下高分细节的不确定性"很有价值,也能避免 MSE 的均值塌陷。代价是推理需多步迭代,比单次前向的 CNN 慢,但仍远快于动力积分。

无论哪一类,AI 降尺度相对动力降尺度的共同卖点都是推理极快:训练一次成本高,但训练好之后做一次降尺度只需一次(或几步)前向传播,毫秒到秒级,可批量、可集合,把过去想都不敢想的"情景批量演算"变得触手可及。

AI 超分辨率 vs 动力 / 统计:优劣对照

把三条路线放在工程关心的几个维度上逐条对照,能避免被"AI 更先进"这类口号带偏。

计算成本与速度。 AI 降尺度训练贵、推理极便宜,单次降尺度毫秒到秒级;动力降尺度无训练成本但每次都要重算物理方程,单场高分模拟动辄数小时到数天;传统统计降尺度最轻,但表达力也最弱。要批量、要集合、要实时刷新,AI 与统计占优;要一次性、高保真的物理场,动力仍是金标准。

物理一致性。 这是动力降尺度的护城河:它满足质量、动量、能量守恒,产出的场是自洽的。AI 与统计方法都不内禀守恒——AI 可能生成物理上不可能的细节。近年有"physics-informed""物理约束"的研究试图把守恒律或已知物理关系塞进网络损失或结构里,但能否真正闭合守恒,仍需逐案例验证,不能想当然。

空间结构重建。 这恰是 AI 超分辨率相对传统统计降尺度的最大增益。逐点回归、分位数映射这类方法本质是逐格点订正,几乎不改空间形态;而卷积与注意力机制能从地形、地表类型等静态因子里学出局地纹理,重建出锐利的场边界和地形相关的精细结构。换句话说,传统统计降尺度修的是"值",AI 超分辨率还能修"形"。

极端值与方差保真。 MSE 训练的确定性 AI 会抹平极端,与最朴素的插值殊途同归;GAN、扩散等生成式方法专门为恢复真实功率谱和极端尾部而生,在这一维度反而可能优于很多传统统计方法。但"恢复出来的极端是不是真的"需要独立验证——生成式模型既能补回真极端,也能造出假极端。

泛化与外推。 这是 AI(及一切统计降尺度)共同的根本边界。它们学的是训练分布内的相关关系,遇到训练里没见过的地形、罕见环流形态、或气候变化导致的分布平移,泛化没有理论保证;而动力降尺度解的是不随气候漂移的物理方程,外推稳健性天然更强。一句话:AI 降尺度快且会"修形",但它不懂物理,越是离开训练分布越要当心。

落地:与运梦气象 API 的关系

把上面的对照翻译成新能源工程的实操,有几条很实在的纪律。

先想清楚你要"快"还是要"准物理"。 做大批量历史回测、集合情景、需要快速刷新的超短期链路,AI/统计降尺度的速度优势无可替代;做单点高保真风资源评估、复杂地形选址,动力降尺度的物理一致性更值得那点算力。多数成熟团队是混合用:用降尺度得到结构逼真的高分背景场,再用实测做偏差订正,绝不把任何单一降尺度产物当真值直接用。

降尺度之后,偏差订正不能省。 无论用哪条路线得到高分场,落到机位前都该用站点实测(测风塔、辐照仪、计量发电)做一道分位数映射类的偏差订正——尤其对 AI 生成式结果,要用 reliability diagram、功率谱、极端命中率等多个口径核验它"修出来的细节"是真是假,而非只看 RMSE。

用多源数据搭一个"历史回测—预报上线—交叉验证"的闭环。 运梦气象 API 把多套数据源放在同一接口下,正适合这种闭环:历史回测与降尺度训练/标签对齐走 ERA5(dataSourceId=era5),运梦产品的历史数据范围覆盖 1950 年至今(ERA5 数据集本身可回溯到 1940 年);上线预报场切到 ger(德国气象局预报源),字段与代码框架可直接复用;再用 NASA、zg1 等其他源做交叉验证,只需替换 dataSourceId

落到字段:风电关注 100 米高度的 u100 / v100 及派生 ws / wd,可加 tas / sp / hurs 辅助稳定度与空气密度订正;光伏关注 rsds / dni / dhi 等辐射要素。一个面向降尺度回测的最小取数请求长这样:

{
  "dataSourceId": "era5",
  "lat": 26.85,
  "lon": 100.23,
  "stime": "2024-01-01 00:00",
  "etime": "2024-12-31 23:00",
  "fields": ["u100", "v100", "ws", "wd", "rsds", "dni", "tas", "sp"],
  "timezone": "8"
}

把它 POST 到 downloadSync 接口,即可同步拿到 JSON envelope,data.timeList 与各字段数组按下标一一对应。拿到序列后,就能按本文思路推进:评估粗网格在该地形位置的可信度,选择动力或 AI 降尺度重建高分场,用实测做分位数映射订正,再以多源对比量化不确定性。字段口径与单位以官方文档为准——完整字段表见 /docs/weather/data-elements/,接口参数见 /docs/weather/api-reference/,ERA5 数据源说明见 /products/weather-api/era5/,动力降尺度的姊妹篇见 /blog/wrf-dynamical-downscaling/

AI 超分辨率降尺度是个好工具,但它不是绕过物理与验证的捷径。把它当作"会修形、但不懂物理、且越出训练分布越要警惕"的高分背景场生成器,再用偏差订正与多源交叉验证守住底线,才是把它的速度红利稳妥变现的姿势。

常见问题

AI 气象降尺度和传统统计降尺度是一回事吗? 本质同源——AI 超分辨率降尺度属于统计降尺度的一种,学的都是相关关系而非物理方程,因此共享"训练分布外泛化无保证"的根本边界。区别在表达力:传统方法多是逐格点回归或分位数映射,几乎不改空间形态;AI 的卷积/注意力能重建局地地形纹理与锐利场边界,既修"值"也修"形"。

为什么有些 AI 降尺度结果看起来很"糊"、把极端值抹平了? 那通常是用 MSE/MAE 训练的确定性 CNN(如 SRCNN 一类)的"回归到均值"副作用:当一个低分输入对应多种高分可能时,最小化均方误差的最优解是输出平均,从而抹平小尺度方差和极端。GAN、扩散等生成式方法专门恢复真实功率谱与极端尾部,能缓解这一点,但要警惕它造出物理不可信的假细节。

AI 降尺度能取代 WRF 这样的动力降尺度吗? 不能简单替代。动力降尺度满足守恒律、物理自洽、外推稳健,是高保真单点场的金标准;AI 降尺度快、可批量,但不内禀守恒、离开训练分布泛化没保证。务实做法是混合使用,并对任一产物都叠加实测偏差订正。

做新能源功率预测,AI 降尺度的极端值能直接信吗? 不能直接信。生成式 AI 既可能补回真极端,也可能造出假极端,必须用 reliability diagram、功率谱、极端命中率等多口径独立验证,而非只看 RMSE;落机位前再用站点实测做分位数映射偏差订正。

在运梦气象 API 上怎么取数做降尺度回测? 历史回测与降尺度标签对齐用 ERA5(dataSourceId=era5,运梦历史数据覆盖 1950 年至今),上线预报切到德国气象局(dataSourceId=ger)。风电拉 u100 / v100 / ws / wd 等、光伏拉 rsds / dni / dhi 等,POST 到 downloadSync 接口同步取数,再叠加实测偏差订正与多源交叉验证。