气象数据

全球能源预测竞赛 GEFCom2012 — Hong 2014 与预测基准

2026-03-29 · 南京运梦科技算法团队 · 评审算法负责人

做新能源功率预测的团队，几乎都会在某个阶段陷入同一种焦虑：自家模型在内部回测里看起来不错，可一旦换个数据集、换个评价口径，结论就翻了盘。到底是模型真的更好，还是只是恰好拟合了某一段历史？没有一把公认的尺子，所有人都在用各自的数据、各自的指标自说自话，行业里很难形成可复现、可比较的进步。

这种"各练各的"的困境，正是十几年前能源预测领域的真实写照。直到一场竞赛把大家拉到同一条起跑线上：同样的数据、同样的任务、同样的评分规则，让负荷预测和风电预测第一次有了可以横向比较的公开基准。这场竞赛就是 GEFCom2012（Global Energy Forecasting Competition 2012），全球首届能源预测竞赛。

本文基于 Tao Hong、Pierre Pinson 与 Shu Fan 于 2014 年发表在 International Journal of Forecasting 的综述文章，梳理 GEFCom2012 做了什么、为什么重要，以及它对今天的新能源功率预测工程意味着什么。我们也会演示如何用运梦气象 API 准备这类预测任务所需的气象输入数据。

关键要点

GEFCom2012 是首届全球能源预测竞赛，由 Tao Hong、Pierre Pinson、Shu Fan 组织，在 Kaggle 平台上举办，并以综述形式发表于 International Journal of Forecasting (2014)。
竞赛设置两大赛道：负荷预测（load forecasting）与风电预测（wind power forecasting），覆盖了电力系统供需两侧的核心预测问题。
负荷预测赛道是分层负荷（hierarchical load）任务——多个区域负荷自下而上加总，温度被强调为关键驱动因子，并采用回测（backcasting）方式补全历史。
风电预测赛道基于数值天气预报（NWP）的风场来预测风电出力，要求提交点预测（按 RMSE 评分）；概率/分位数预测则是后续 GEFCom2014 才引入的创新。
竞赛产出了公开基准数据集，把能源预测从分散研究推向统一基准、可复现比较的阶段，并直接催生了后续的 GEFCom2014。

背景与定位

GEFCom2012 的三位组织者各有所长：Tao Hong 长期深耕电力负荷预测，Pierre Pinson 在风电与概率预测方向有深厚积累，Shu Fan 则在电力系统预测建模上经验丰富。三人合作组织的这场竞赛，发表在预测领域的权威期刊 International Journal of Forecasting，本身就标志着能源预测从工业界实践走向学术界系统化研究的一次合流。

竞赛之所以重要，在于它解决了一个长期被忽视却致命的问题：缺乏统一基准。在 GEFCom2012 之前，负荷预测和风电预测的研究大多基于各自私有的数据集，方法之间难以公平比较，论文里"我的方法更好"的结论往往无法被独立复现。竞赛把任务、数据、评分规则全部公开并统一，让来自世界各地的大量队伍在同一套规则下同台竞技。

更深远的影响在于赛后。竞赛产出的完整数据集（包括解集）被公开发布，成为社区的标准测试集。此后大量研究都以这套数据作为 benchmark，新方法只要在这套公开数据上跑一遍，就能和既往结果直接对比。可以说，GEFCom2012 把能源预测领域从"各练各的"推向了"同台比武"，这是它最持久的贡献。

方法 / 它做了什么

负荷预测赛道采用的是分层负荷（hierarchical load）设定。简单说，电网被划分为多个区域，每个区域有各自的负荷曲线，而顶层的总负荷是各区域之和——区域负荷自下而上加总，构成一个分层结构。参赛者需要在这个结构上同时给出各层级的预测，既要保证单区域准确，又要让加总后的总量合理。这种设定贴近真实电网调度场景：调度既关心局部馈线，也关心全网平衡。

负荷预测赛道的一大特点是强调温度作为关键驱动因子。电力负荷与气温之间存在强烈的非线性关系——夏季制冷、冬季供暖都会随温度剧烈波动，呈现典型的"U 形"或"V 形"响应曲线。竞赛把温度数据作为核心输入，引导参赛者构建以温度为主驱动的负荷模型。此外，负荷赛道还引入了回测（backcasting）任务，即不仅预测未来，还要回溯补全历史上缺失的负荷值，这对模型刻画负荷与温度等驱动因子之间稳定关系的能力提出了更高要求。

风电预测赛道则是另一类问题。它要求参赛者基于数值天气预报（NWP）给出的风场预测，来推断风电场的出力。风速到功率的转换天然是非线性的——存在切入风速、额定平台和切出风速，再叠加风向、机组排布尾流等因素，使得这条"风到电"的映射远比看上去复杂。GEFCom2012 的风电赛道要求提交确定性点预测（按 RMSE 评分）；把预测扩展为完整的不确定性分布（概率/分位数预测）则是后续 GEFCom2014 的核心创新。

为了让横向比较有意义，竞赛对所有提交采用统一的评分规则与公开数据。综述文章不仅介绍了两个赛道的问题设定、数据构成，还总结了若干顶尖队伍所采用的方法。这些方法吸引并推动了梯度提升（gradient boosting）、组合/集成模型（ensemble）等当时较为先进的机器学习技术在能源预测中的应用，为整个领域带来了方法论上的扩散效应。

关键结论

GEFCom2012 确立了"统一数据 + 统一任务 + 统一评分"的竞赛范式，把负荷预测与风电预测纳入同一框架，使不同方法第一次可以在公平条件下横向比较。
负荷预测赛道证明了分层负荷建模的可行性与价值：在多区域加总的结构下，温度作为关键驱动因子，是构建高质量负荷模型的核心抓手；回测任务则进一步检验了模型对驱动关系的刻画能力。
风电预测赛道展示了以 NWP 风场为输入、提交确定性点预测（RMSE 评分）的主流技术路线；不确定性量化（概率/分位数预测）的必要性则在后续 GEFCom2014 正式纳入概率预测后才得以凸显。
竞赛吸引了大量队伍参与，推动了梯度提升、组合模型等先进方法在能源预测中的落地与传播（参与规模为定性描述，具体队伍数以原文及竞赛页面为准）。
竞赛产出的公开基准数据集成为后续研究的标准测试集，并直接为强调概率预测、引入 CRPS 与 pinball loss 评分的 GEFCom2014 奠定了基础。

需要说明：本节只归纳论文与竞赛本身所报告的事实。文中如涉及具体阈值（如风机切入/切出风速）、模型超参等数字，均属一般工程经验或示意，并非该综述给出的结论。

对新能源 / 运梦平台的意义

GEFCom2012 留给新能源行业最实用的一课，是"驱动因子比模型更重要"。负荷预测赛道反复强调温度，风电赛道把 NWP 风场作为核心输入——这都在提醒我们：再精巧的模型，若没有高质量、口径一致的气象驱动数据，也难以稳定泛化。对运梦气象平台而言，这恰恰是我们的着力点：把多源气象数据整理成统一、可复现、便于建模的输入。

对照负荷预测的温度驱动思路，运梦平台可以用德国气象局（ger）数据源获取 tas（近地面气温）预报，用于驱动温度敏感型负荷模型；历史侧则用 era5 再分析数据获取一致口径的历史气温，构建"历史训练—未来预测"无缝衔接的特征体系。这样负荷模型在训练与推理阶段看到的温度口径保持一致，避免因数据源切换带来的系统性偏差。

对照风电预测的 NWP 风场思路，运梦平台提供 ger 数据源的 u100、v100（100 米高度风速分量）与 ws（合成风速），直接对应风电赛道所需的轮毂高度风场输入。工程实践中，可以由 u100、v100 计算风速与风向，再结合机组功率曲线完成"风到电"的转换；若需要刻画出力不确定性，还可在多预报或多成员的基础上构造分位数预测，呼应 GEFCom2014 引入的概率预测理念。

更宏观地看，GEFCom 系列竞赛所倡导的"统一基准、可复现比较"理念，正是运梦气象希望在工程层面落地的价值：用稳定的数据接口、清晰的字段口径和一致的单位约定，让每一支算法团队都能把精力放在模型本身，而不是反复纠结数据从哪来、单位对不对、历史和预报能不能拼。

在运梦气象 API 上手

要复现一个类似 GEFCom2012 的实验，第一步是准备气象驱动数据。下面以风电赛道为例，用运梦气象 downloadSync 接口从德国气象局（ger）数据源拉取某风电场点位的风场与相关字段——包含 100 米风速分量 u100、v100，合成风速 ws，以及近地面气温 tas 和地表短波辐射 rsds，方便后续同时支撑风电与温度敏感型负荷建模。

字段单位均已由 API 后处理为工程常用单位：ws、u100、v100 为 m/s，tas 为 °C，rsds 为 W/m²，无需再做 Kelvin 或单位换算。负荷历史侧建议另用 era5 数据源拉取同口径的历史 tas，与 ger 的预报口径配套使用。

{
  "dataSourceId": "ger",
  "lat": 32.05,
  "lon": 118.78,
  "stime": "2026-06-10 00:00",
  "etime": "2026-06-12 23:00",
  "fields": ["tas", "u100", "v100", "ws", "rsds"],
  "timezone": "8"
}

常见问题

问：GEFCom2012 一共有几个赛道？ 答：两个赛道——负荷预测（load forecasting）和风电预测（wind power forecasting），分别对应电力系统的需求侧和新能源供给侧。

问：负荷预测赛道里的"分层负荷"是什么意思？ 答：电网被分成多个区域，每个区域有各自的负荷，而顶层总负荷是各区域之和。参赛者要在这个自下而上加总的分层结构上同时给出各层级预测，既准确又自洽。

问：为什么竞赛特别强调温度？ 答：电力负荷与气温高度相关，制冷和供暖需求会随温度剧烈非线性变化。把温度作为关键驱动因子，是构建高质量负荷模型的核心，因此竞赛把它放在了中心位置。

问：GEFCom2012 和 GEFCom2014 有什么区别？ 答：GEFCom2012 是首届，奠定了统一基准的范式；后续的 GEFCom2014 更强调概率预测，引入了 CRPS 与 pinball loss 等评分方式，进一步推动了不确定性量化。

问：用运梦气象 API 准备这类数据时，历史和预报怎么衔接？ 答：预报侧用德国气象局（ger）数据源取 tas 等字段；历史侧用 era5 再分析数据取同口径历史值。两者配套，能让模型在训练与推理阶段看到一致的气象口径，避免数据源切换造成的偏差。

引用与原文

Hong, T., Pinson, P., & Fan, S. (2014). Global Energy Forecasting Competition 2012. International Journal of Forecasting, 30(2), 357–363. doi.org/10.1016/j.ijforecast.2013.07.001

相关阅读