气象数据

数值天气预报的安静革命 — Bauer 2015 Nature 综述

2022-05-14 · 南京运梦科技算法团队 · 评审算法负责人

做新能源功率预测的团队，几乎每天都要面对同一个朴素的问题：明天、后天、一周后的风和光，到底能不能信？当你把一个风电场的发电曲线和气象预报曲线叠在一起看，会发现绝大部分误差并不来自你的机器学习模型有多"笨"，而是来自喂给它的那份数值天气预报（NWP）本身。气象预报准一分，功率预测的底座就稳一分；气象预报塌一截，再精巧的后处理也只是把噪声打磨得好看一点而已。

很多人对天气预报的印象还停留在"经常报不准"的吐槽上，却很少意识到过去几十年它其实经历了一场静悄悄、却影响深远的进步。Peter Bauer、Alan Thorpe 与 Gilbert Brunet 在 2015 年发表于 Nature 的综述 The quiet revolution of numerical weather prediction，用一个词概括了这场变化：安静的革命（quiet revolution）。说它"安静"，是因为它不像某次物理学突破那样轰动，而是科学认知与算力长年累月叠加出来的稳步攀升——少有人察觉，却已经深刻改变了我们能多早、多准地预知大气。

这篇文章为做新能源、做功率预测、做气象数据接入的工程师梳理这篇综述的核心观点，并把它落到一个具体问题上：当我们在运梦气象平台上调用历史再分析做训练、调用业务预报做上线时，理解 NWP 的本质能帮我们做出哪些更聪明的工程决策。

关键要点

过去数十年，NWP 的有效预报时效以每十年约提升一天的速度稳步前进：今天的 6 天预报，大致相当于 10 年前的 5 天预报、20 年前的 4 天预报。
NWP 本质是一个初值问题（initial value problem）：大气是混沌系统，预报结果对初始状态高度敏感，初始场差一点，几天后就可能差很多。
进步建立在三大支柱上：资料同化（把卫星、探空、地面等观测融入模式初始场）、不断增长的卫星观测，以及持续增长的超级计算能力。
作者强调用集合预报（ensemble）量化不确定性，并推动地球系统耦合（大气—海洋—陆面）来逼近真实物理。
之所以称"安静的革命"，是因为这些进步渐进、累积、少有戏剧性，因而长期不被公众察觉，却已是物理科学中影响最大的成就之一。

背景与定位

这篇综述的三位作者来头都不小：Peter Bauer 与 Alan Thorpe 均来自欧洲中期天气预报中心（ECMWF，Thorpe 时任 ECMWF 总干事），Gilbert Brunet 则来自加拿大环境部。这样的作者组合本身就说明了一件事：现代数值天气预报不是某一个实验室的成果，而是全球业务化机构、观测网络与超算中心长期协作的产物。

文章发表在 Nature 上，定位是一篇面向广泛科学读者的综述，而非单一新方法的论文。它要回答的核心问题是：为什么天气预报在过去几十年里悄悄变得这么好？又是什么科学与工程要素在背后推动？作者给出的答案不是某个单点突破，而是"渐进式累积"——这正是"安静的革命"这个标题的全部分量所在。

对做新能源的人来说，这篇综述的价值在于：它把"预报为什么会准、为什么会有上限"讲清楚了。理解了 NWP 是初值问题、理解了资料同化和算力是如何协同的，你就能更理性地看待手里的预报数据——既不会盲目相信一周后的逐时风速，也不会因为短期不确定性就否定中期趋势的工程价值。

方法 / 它做了什么

作为一篇综述，这篇文章"做"的是系统梳理与定性论证，而不是提出新模型。它首先确立了一个朴素却根本的框架：天气预报是一个初值问题。大气运动遵循已知的流体力学与热力学方程，原则上只要给定足够准确的初始状态，就能往前积分出未来的演化。问题在于，大气是混沌的——初始状态里一点点误差，会随时间被放大，这就是预报存在内禀时效上限的根源。

正因为初始场如此关键，资料同化（data assimilation）成了 NWP 的心脏。作者强调，资料同化要把来自卫星、探空气球、地面站、飞机、船舶等海量、异构、分布不均的观测，与模式的背景场（上一轮预报）做最优融合，生成一个尽可能贴近真实大气、又物理自洽的初始场。这一步做得越好，后续积分的起点就越准，预报时效就越长。

第二根支柱是观测，尤其是卫星观测的持续增长。作者指出，正是越来越丰富的卫星资料，让模式得以"看见"过去观测稀疏的广大海洋与高空区域，极大改善了初始场质量。第三根支柱是超级计算能力的稳步增长：更强的算力意味着更高的分辨率、更完整的物理过程、以及更大规模的集合，三者共同把预报推向更细、更准、更能刻画不确定性的方向。

在此基础上，文章还讨论了两个方向性的方法论。其一是集合预报：与其给出一条"确定"的预报曲线，不如运行多条略有扰动的预报，用它们的离散程度来量化未来的不确定性——这对决策远比一个单点数字有用。其二是地球系统耦合：把大气与海洋、陆面、海冰等分量耦合起来，让模式更接近真实地球的物理图景。最后，作者展望了未来的挑战：更高分辨率、对流尺度（convective-scale）的显式刻画，以及迈向 exascale 的计算需求。

关键结论

**预报技巧在稳步提升，约每十年提升一天有效时效。**这是综述给出的标志性论断：今天的 6 天预报，质量大致相当于 10 年前的 5 天预报、20 年前的 4 天预报。它说明 NWP 的进步是真实、可量化、且持续的。
**NWP 是初值问题，对初始状态高度敏感。**大气的混沌特性决定了预报存在内禀时效上限，初始场的微小误差会被指数放大——这既解释了为什么短期预报远比长期可靠，也解释了为什么改进初始场（即资料同化）回报如此之高。
**资料同化、卫星观测、超级计算是三根支柱，缺一不可。**作者明确将进步归因于这三者的协同，而非某个孤立的算法突破；它们彼此放大，共同把预报时效一年年往外推。
**集合预报与地球系统耦合是正确方向。**用集合量化不确定性、用耦合逼近真实物理，是综述所肯定的方法论趋势，也是把"一条曲线"升级为"一个概率分布"的关键。
**这是一场"安静的革命"。**进步因其渐进累积而少被察觉，却已是物理科学中影响最深远的成就之一——这一定性判断是整篇综述的统摄性结论。

需要说明的是，工程实践中我们还会用到很多更具体的数字（比如某个风场的预报误差、某次后处理带来的提升幅度），但这些属于业界经验或项目示意，并非这篇 2015 年综述所报告的内容，本文不会把它们冒充为原文结论。

对新能源 / 运梦平台的意义

第一点启示直接而务实：**功率预测的天花板，很大程度上由 NWP 的天花板决定。**既然综述指出预报技巧每十年才提升约一天，那就意味着中长期（比如 7 天以上）的逐时风光预报，其内禀不确定性是客观存在、短期内无法靠算法消除的。与其在远端时效追求虚假的"精确逐时值"，不如把工程精力放在两件更有回报的事上：用好近端时效的高质量预报，以及用集合/概率方法老老实实地把不确定性表达出来，交给调度与交易侧去做风险决策。

第二点是关于数据底座的选择。综述反复强调初始场质量的重要性，而再分析数据集（如 ERA5）正是"用今天最好的同化系统、回头重做历史"的产物——它本身就是 NWP 加资料同化的结晶。这就是为什么我们建议：做历史回测与模型训练，用 dataSourceId=era5（ERA5 再分析，覆盖 1940 年至今），因为它在时间上一致、在物理上自洽，最适合给机器学习模型当"标签"和特征底座。

第三点是上线预报的选择。训练用再分析，上线却要用真正向前看的业务预报。在运梦平台上，**上线预报我们采用 dataSourceId=ger（德国气象局）**作为业务预报源。它是成熟的业务化 NWP 产品，符合综述所描述的"业务化机构持续迭代"的路径，能为风光功率预测提供稳定的未来时段气象输入。

第四点是对"误差归因"的态度转变。理解了 NWP 是初值问题、理解了它的内禀上限，团队在复盘预测偏差时就能更冷静：哪些误差源于气象输入的客观不确定性（无法靠模型消除），哪些才是后处理或特征工程真正能改善的部分。把这两类误差分开看，资源投放才不会错位——这正是读懂这篇综述带给工程团队最实际的好处。

在运梦气象 API 上手

落到代码，最常见的起点是为某个站点拉一段历史气象，喂给功率预测模型做训练。下面这个例子用 ERA5 再分析（dataSourceId=era5），拉取一段时间的 100 米风速分量、合成风速、近地面气温与地表短波辐射等字段，时区按东八区（timezone 为 "8"）。其中 u100/v100 是 100 米高度的风速 U/V 分量，ws 是合成风速（m/s），tas 是近地面气温（API 已后处理为 °C，无需再做开尔文换算），rsds 是地表向下短波辐射（W/m²），常用于光伏出力建模。

正式上线预报时，把 dataSourceId 换成 ger（德国气象局），并把时间窗换成未来时段即可，字段约定保持一致——训练与推理用同一套字段口径，能最大程度避免分布漂移。

{
  "dataSourceId": "era5",
  "lat": 32.05,
  "lon": 118.78,
  "stime": "2024-01-01 00:00",
  "etime": "2024-12-31 23:00",
  "fields": ["u100", "v100", "ws", "tas", "rsds"],
  "timezone": "8"
}

常见问题

Q：为什么训练用 era5，上线却用 ger？ A：ERA5 是再分析，用今天最好的同化系统回头重做历史，时间一致、物理自洽，适合当训练标签与特征底座；但它是"回看历史"，不能向前预报。上线需要真正面向未来的业务预报，所以用德国气象局的 ger。一句话：era5 学规律，ger 做预测。

Q：综述说预报每十年只提升约一天，那做 7 天以上的逐时风光预报还有意义吗？ A：有，但要换个用法。远端时效的逐时精确值确实不可靠，这是大气混沌带来的内禀上限；但中期的趋势与概率分布仍有工程价值。建议远端用集合/概率方式表达不确定性，而不是给一条假装精确的曲线。

Q：NWP 是初值问题，这对我们做功率预测意味着什么？ A：意味着气象输入里有一部分误差是客观的、无法靠你的模型消除的。复盘偏差时要把"气象输入的内禀不确定性"和"后处理可改善的部分"分开，资源才会投到真正能改善的地方。

Q：tas 字段是开尔文还是摄氏度？需要我自己换算吗？ A：不需要。运梦 API 已把 tas 后处理为摄氏度（°C）。同理 rsds/dni/dhi 是 W/m²、ws 是 m/s、hurs 是百分比，拿到即用，无需再做单位换算。

Q：为什么我应该关心一篇 2015 年的综述？ A：因为它把"预报为什么会准、为什么有上限"这件根本的事讲透了。理解 NWP 的本质，能让你在选数据源、定时效、做误差归因时少走弯路——这些判断的价值，远比追逐某个最新模型更长久。

引用与原文

Bauer, P., Thorpe, A., & Brunet, G. (2015). The quiet revolution of numerical weather prediction. Nature, 525(7567), 47–55. doi.org/10.1038/nature14956

相关阅读