风电功率预测方法全景 — Foley 2012 综述精读

风电场的运营者大概都经历过这样的一天:早上交易申报时填的出力曲线和下午实际并网的功率对不上,调度考核扣分、偏差电量被罚款,复盘会上有人说"预测又不准了"。问题是,"不准"的根因到底在哪——是上游天气没报对,还是功率曲线拟合得差,又或者根本用错了方法?在还没有把"风电功率预测"这件事拆解清楚之前,每一次复盘都容易停留在情绪而非工程层面。
风的随机性、间歇性,再叠加湍流、地形、尾流这些微尺度效应,让风电出力天然比光伏更难预测。但"难"不等于"没有章法"。学术界和工业界其实早已把风电功率预测的方法体系梳理得相当清楚:哪些方法适合超短期、哪些方法在中短期更可靠、为什么持续法到现在还是绕不开的基准。把这套方法论搞明白,是从"碰运气式预测"走向"可工程化优化"的第一步。
本文精读 Foley、Leahy、Marvuglia 与 McKeogh 四位作者 2012 年发表在《Renewable Energy》上的综述《Current methods and advances in forecasting of wind power generation》。这篇文章在风电功率预测领域被反复引用,它的价值不在于提出某个新模型,而在于把当时主流的方法版图——物理、统计、混合三大类——讲清楚,并指明了 NWP(数值天气预报)作为核心上游驱动的地位。我们会逐段拆解它的结论,再结合运梦气象 API 谈谈这些方法在今天如何落地。
关键要点
- Foley 等(2012)把风电功率预测方法系统地归为三类:物理方法(physical)、统计方法(statistical)、混合方法(hybrid);论文指出混合方法能兼得物理与统计两类方法的部分优势(工程实践中也确实越来越多采用混合路线)。
- 物理方法以 NWP 风场为基础,经微尺度/地形降尺度再用功率曲线映射到电场出力,在较长时效上更占优势;统计方法用历史数据建立 NWP 或实测到出力的统计映射,在短时效上更占优势。
- 持续法(persistence)在超短期(数小时内)几乎无法被超越,是评估任何预测方法都必须保留的基准线。
- NWP 质量是中短期预测精度的决定性上游因素;集合预报(ensemble)则用于刻画预测的不确定性。
- 时间尺度需要区分对待:超短期(分钟到小时级)、短期(数小时到 72 小时)、中期,各自的适用方法不同,没有"一招通吃"的模型。
背景与定位
这篇综述的四位作者来自爱尔兰高校,长期关注风电高渗透率电网下的功率预测与并网问题。2012 年前后,欧洲多国风电装机快速增长,电力市场的日前与日内交易对功率预测精度提出了实打实的经济要求——预测偏差直接转化为平衡市场上的罚金。在这样的背景下,一篇把"现有方法到底有哪些、各自强在哪"梳理清楚的综述,对工程师和研究者都很有用。
文章发表在《Renewable Energy》第 37 卷第 1 期,是该领域被广泛引用的综述之一。它没有局限在某一种算法,而是站在方法论的高度,回答了三个问题:风电功率预测可以分成哪几类方法?这些方法各自适合什么时间尺度?评估预测好坏应该用什么基准和指标?
对今天的从业者来说,这篇文章的意义在于提供了一张"方法地图"。即便这十多年里深度学习、概率预测等新技术层出不穷,物理/统计/混合的三分法、NWP 作为核心驱动、持续法作为基准这些骨架性的认识依然成立。理解这张地图,能帮助团队在选型时不被纷繁的模型名词带偏,回到"这个场景该用哪类方法"的本质问题上。
方法 / 它做了什么
综述首先确立了风电功率预测的三大方法类别。物理方法以 NWP 给出的风场为起点:先由全球或区域数值天气预报模型给出某高度层的风速、风向,再通过微尺度模型和地形降尺度(downscaling)把粗网格的气象场细化到风机轮毂高度的局地风况,最后用风机或电场的功率曲线把风速映射为出力。物理方法的链条长、对地形和 NWP 质量敏感,但因为它本质上是在"预测天气再转换成功率",在较长的预测时效上更有优势。
统计方法走的是另一条路:不显式建立大气物理过程,而是用历史数据直接学习从输入(NWP 输出或实测气象、历史出力)到风电出力的统计映射。综述提到的典型手段包括时间序列模型、人工神经网络(ANN)以及各类回归方法。统计方法的好处是实现相对直接、能自动捕捉场站的系统性偏差,在短时效(尤其是超短期)上往往比物理方法更准,因为近期的历史观测携带了很强的惯性信息。
混合方法则是物理与统计的结合。综述指出,混合方法能同时获得物理方法与统计方法各自的部分优势。一个常见的工程形态是:用物理方法(NWP + 降尺度)拿到中短期的气象趋势,再用统计/机器学习模型对这条物理链路的系统误差做订正,或在不同时间尺度上做加权融合。混合方法试图同时吃到"物理外推的中长期能力"和"统计订正的短期精度",从而在更宽的时效范围内保持稳健,这也是工程实践中越来越普遍的路线。
综述特别强调了**持续法(persistence)**的地位。持续法假设"未来的出力等于当前的出力",简单到近乎朴素,但在超短期(数小时以内)的预测中却极难被复杂模型超越——这是因为在很短的时间窗口里,风况的自相关性极强。正因如此,持续法被确立为评估任何预测方法都必须保留的基准:一个新模型如果在超短期连持续法都打不过,就说明它没有带来真正的增量价值。
在不确定性方面,综述指出**集合预报(ensemble)**是刻画预测不确定性的重要手段——通过运行多组带扰动的 NWP 来给出预测的分布而非单一点值。评价指标上,文章涉及 RMSE、MAE 以及归一化误差等常用度量,用于在统一口径下比较不同方法的表现。贯穿全文的一条主线是:NWP 的质量是中短期预测精度的决定性上游因素——下游模型再精巧,也无法凭空补偿上游气象输入的系统性误差。
关键结论
- 风电功率预测方法可系统归纳为物理、统计、混合三大类(Foley 等,2012)。三者并非互斥,而是各有适用的时间尺度与数据条件。
- 物理方法依赖 NWP 风场加降尺度与功率曲线映射,在较长时效上更占优;统计方法依赖历史数据建模,在短时效(尤其超短期)上更占优(综述结论)。
- 综述指出混合方法能兼得物理与统计两类方法的部分优势——它把物理链路与统计订正结合,力求在更宽的时效范围内兼顾精度与稳健("业界越来越多采用混合路线"为工程经验补充,非论文的量化论断)。
- 持续法在超短期(数小时内)很难被超越,是评估预测方法不可省略的基准;NWP 质量则是中短期精度的决定性上游因素,集合预报用于刻画不确定性(综述结论)。
- 评价应在统一指标下进行,综述涉及 RMSE、MAE 与归一化误差等度量。具体到某个场站能把误差压到多低,属于工程经验/示意范畴,取决于地形、机型与数据质量,原文并未给出可直接套用的固定数值。
对新能源 / 运梦平台的意义
这篇综述的方法分类,几乎可以直接对应到一套工程落地的技术栈。物理方法和混合方法都把 NWP 作为不可或缺的上游——没有靠谱的数值天气预报,物理链路就是无源之水。这正是气象数据服务在风电功率预测中扮演的核心角色:把高质量、可程序化获取的风场预报喂给下游模型,是整条链路精度的地基。
在运梦气象 API 的体系里,预报源采用德国气象局(dataSourceId=ger)作为风电功率预测的输入。对物理方法和混合方法,工程上通常取 100 米高度的风速分量 u100、v100 以及合成风速 ws 作为功率预测的核心输入特征——100 米更贴近现代大兆瓦机型的轮毂高度,相比 10 米风(uas/vas)能减少一次额外的风廓线外推误差。这些字段经 API 后处理为常用单位(ws 为 m/s),可以直接进入功率曲线或机器学习模型。
统计方法和混合方法中的统计订正环节,则需要长时序的历史气象数据来训练。运梦 API 的 era5 历史再分析数据适合承担这个角色:用 era5 的历史 u100/v100/ws 对齐场站的历史出力(SCADA),就能训练出从气象到功率的统计映射,或学习物理链路的系统性偏差订正项。一个常见的混合架构是:实时预测用 ger 预报驱动物理链路,再叠加一层在 era5 历史上训练好的统计订正模型。
需要强调的是,正如综述所言,最优方法依赖场站的具体特征与预测用途。超短期的日内滚动预测可以更多依赖统计/持续法订正,而日前的中短期预测则更依赖 NWP 物理链路的质量。运梦 API 把预报源(ger)与历史源(era5)用统一的字段口径和调用方式打通,正是为了让团队能够灵活地在这两类数据上组合出适合自己场站的物理/统计/混合方案,而不必为不同数据源维护多套数据管线。
在运梦气象 API 上手
下面给出一个最小可用的调用示例:用 downloadSync 接口,从德国气象局预报源(dataSourceId=ger)拉取某风电场坐标的逐时风场预报,取 u100、v100、ws、wd 以及气温 tas 作为功率预测的输入特征。拿到 u100/v100 后即可计算风速与风向,ws 为已合成的风速(m/s),tas 为摄氏度(°C),可用于空气密度订正等后处理。把这批字段对齐到功率曲线或训练好的统计模型,就得到了出力预测。
若要训练统计/混合模型,只需把下例的 dataSourceId 从 "ger" 换成 "era5",并把时间窗口拉长到覆盖历史出力的同期区间,即可获得用于训练的历史气象序列;其余字段口径完全一致,下游特征工程代码无需改动。
{
"dataSourceId": "ger",
"lat": 34.52,
"lon": 119.18,
"stime": "2026-06-09 00:00",
"etime": "2026-06-12 00:00",
"fields": ["u100", "v100", "ws", "wd", "tas"],
"timezone": "8"
}
常见问题
问:物理方法和统计方法,我的风电场到底该选哪个? 答:综述的观点是没有绝对的最优,要看时间尺度和用途。中短期(数小时到 72 小时)的日前预测更依赖物理方法的 NWP 链路,超短期(分钟到小时级)则统计方法和持续法更占优。多数团队最终走向混合方法,把两者结合。
问:持续法这么简单,还有必要保留吗? 答:必须保留,但不是把它当主力模型,而是当基准线。综述明确指出持续法在超短期几乎无法被超越。任何新模型上线前都应先和持续法比一比,超短期打不过持续法的模型不值得部署。
问:为什么风电功率预测要用 100 米的风(u100/v100)而不是 10 米风? 答:现代大兆瓦风机的轮毂高度普遍接近 100 米,u100/v100 更贴近机组实际感受到的风况。用 10 米风(uas/vas)需要额外做风廓线外推到轮毂高度,会引入额外误差。直接取 100 米风可以省掉这一步。
问:预报用 ger、训练用 era5,两套数据混着用会不会有口径问题? 答:运梦 API 对 ger 和 era5 采用统一的字段命名与单位口径(ws 为 m/s、tas 为 °C 等),调用方式也一致。实践中建议在 era5 上训练统计订正模型、在 ger 预报上做实时推理,这正是混合方法的典型形态;为稳妥起见可在历史回测中评估两源的系统性差异并纳入订正。
问:用什么指标评估预测好坏? 答:综述涉及 RMSE、MAE 和归一化误差等常用指标,建议用归一化(按装机容量)后的误差做跨场站比较。若关注不确定性而非单点值,可结合集合预报给出区间或概率预测,再用相应的概率评分指标评估。
引用与原文
Foley, A. M., Leahy, P. G., Marvuglia, A., & McKeogh, E. J. (2012). Current methods and advances in forecasting of wind power generation. Renewable Energy, 37(1), 1–8. DOI: 10.1016/j.renene.2011.05.033