气象数据

MERRA-2 NASA 再分析全解读 — 运梦 `nasa` 数据源的原始论文

· 南京运梦科技算法团队 · 评审 算法负责人

MERRA-2 NASA 再分析全解读 — 运梦 `nasa` 数据源的原始论文 封面

做风电场项目可研时,你是否遇到过这样的困境:现场测风塔只有一两年数据,却要评估未来二十年的风资源?或者光伏电站建在偏远山区,地面气象站稀疏,辐照数据根本找不到?这正是再分析气象数据大放异彩的场景——它用数值模式把卫星、探空、地面站等观测数据"融合重播"一遍,补出任意网格点、任意历史时段的气象场,让资源评估的时间序列一下子从两年延长到四十年。

在众多再分析产品里,NASA 全球建模与同化办公室(GMAO,隶属戈达德太空飞行中心)发布的 MERRA-2 是继 ERA5 之后最常被工程师引用的数据集之一。它的独特之处在于全球首个正式引入气溶胶协同同化的再分析,对光伏辐照评估有特殊意义:中国西部和南亚地区频繁出现沙尘、污染气溶胶,按大气辐射传输的一般认识,气溶胶会明显衰减到达地表的太阳辐射,若在辐照重建中忽略这一过程,理论上会高估 GHI,从而直接影响电站的发电量预测。运梦气象 API 中的 dataSourceId: "nasa" 就对应这套数据集,覆盖 1980 年至今、全球任意坐标点的逐小时历史气象。

本文系统解读 MERRA-2 的奠基论文——Gelaro 等(2017)发表于 Journal of Climate 的核心文章——帮助新能源工程师和数据科学家真正读懂 nasa 数据源背后的方法论、精度边界与适用场景,从而在项目中做出更有底气的数据源选择。

关键要点

  • MERRA-2 是 NASA GMAO 的第二代全球大气再分析,时间跨度从 1980 年延伸至今,是目前时间连续性最长的公开再分析之一。
  • 水平分辨率约 0.5°×0.625°(赤道附近约 50 km),垂直方向分为 72 层,近地层单层诊断可直接获取 2 m、10 m、50 m 风速;100 m 轮毂高度风速并非 MERRA-2 原生输出(这恰是 ERA5 的强项),需由 50 m 外推或改用 era5
  • 核心技术突破:气溶胶协同同化——把 AOD(气溶胶光学厚度)观测直接纳入同化系统,是 ERA5 没有的能力,对光伏辐照评估意义重大。
  • 与 ERA5 形成互补:ERA5 在云和降水方面通常表现更优,MERRA-2 在气溶胶敏感地区的辐照精度有独特优势,两者结合可做交叉验证。
  • 运梦 API 中使用 dataSourceId: "nasa" 即可调取 MERRA-2 历史数据;预报场请使用 "ger"(德国气象局),两者定位不同,切勿混用。

背景与定位

2017 年,Ronald Gelaro 及其在 NASA 戈达德太空飞行中心的同事团队,在 Journal of Climate 第 30 卷发表了题为《The Modern-Era Retrospective Analysis for Research and Applications, Version 2 (MERRA-2)》的长文。这篇论文长达 36 页,是整个 MERRA-2 数据集的"出生证明",详细描述了同化系统架构、输入观测资料、质量控制流程以及与第一代 MERRA 及其他再分析的比对验证。彼时 ERA5 尚未正式对外发布(ERA5 论文于 2020 年才发表),MERRA-2 在全球再分析领域属于最先进的公开产品之一。

在学术影响力层面,该论文截至 2025 年引用量已超过六千次,是气候学、能源气象、大气科学领域的高频引用文献。期刊 Journal of Climate 隶属美国气象学会(AMS),影响因子长期处于约 4–5 区间(近年约 4.0),是大气科学领域的主流顶级期刊之一,在同行评审的严格性和数据方法的可重复性上有极高要求。这意味着 MERRA-2 的精度声明有充分的同行审核背书。

对新能源行业而言,选用再分析数据往往是项目可研阶段的"隐性决策"——工程师很少追溯数据来源,但不同再分析在特定地区的系统偏差可能导致发电量预测偏差数个百分点,直接影响项目的 IRR 和融资谈判结果。了解 MERRA-2 的方法论边界,是做负责任的资源评估的基础。

方法 / 它做了什么

MERRA-2 的核心同化引擎是 NASA 自研的 GEOS-5(Goddard Earth Observing System, Version 5),采用 三维变分(3D-Var) 同化框架。与欧洲中期天气预报中心(ECMWF)用于 ERA5 的 4D-Var 相比,3D-Var 不在时间维度上迭代,计算成本更低,使得 MERRA-2 能够以业务级资源持续回算数十年的全球大气状态。同化窗口设为 6 小时,意味着每个分析时刻都融合了前后各 3 小时内的观测资料。

在观测输入方面,MERRA-2 同化的资料种类极为丰富:包括常规地面站、无线电探空仪、船舶、飞机 AMDAR 报告,以及来自 NOAA、NASA、ESA 等多个卫星平台的辐射率(radiances)、散射计风、掩星资料等。最具特色的是将 MODIS、MISR、AERONET 等多源 AOD(Aerosol Optical Depth)观测纳入同化循环,这在全球再分析中属于首创。气溶胶不仅影响辐射传输(直接效应),还通过改变云的微物理特性影响降水(间接效应),将其纳入同化显著改善了辐照和水文循环字段的一致性。

在空间分辨率设计上,MERRA-2 采用 0.5° 纬度 × 0.625° 经度 的水平网格,在赤道附近约对应 56 km × 70 km 的格距;垂直方向从地面到 0.01 hPa(约 80 km 高空)共分 72 个混合 sigma-pressure 层,低层大气层结加密,确保边界层参数化的精度。时间输出频率方面,二维单层(single-level)产品为逐小时,且同时包含瞬时(instantaneous)与时均(time-averaged)两类字段;三维等压层(pressure-level)产品则为逐 3 小时。新能源资源评估常用的近地层风速、辐射、气温都来自逐小时单层产品,这一时间分辨率足以支撑风电光伏的小时尺度发电量模拟。

论文中对主要气象变量进行了系统性的验证评估。在近地层风场方面,论文显示 MERRA-2 同化系统对无线电探空、卫星等观测的背景拟合较前一代 MERRA 有所改善,10 m 风速偏差在大多数陆地区域亦优于前一代。在辐照字段方面,引入气溶胶同化后,地表向下短波辐射(SWGDN)在中东、南亚、北非等气溶胶活跃地区的月均偏差显著下降,但在高纬度多云地区偏差仍然存在。论文特别指出,降水字段仍是再分析产品的薄弱环节,MERRA-2 通过改进降水约束(precipitation constraint)一定程度上缓解了大气水汽质量守恒问题,但与实测降水的误差仍不可忽视。

MERRA-2 还特别关注了**行星边界层高度(PBLH)**的输出,这对风电资源评估有直接意义:PBLH 决定了风的垂直结构和湍流强度,是估算轮毂高度(通常 80–150 m)风速时做垂直外推的重要参考。相比仅提供 10 m 单一高度的部分气候数据集,MERRA-2 在近地层同时提供 2 m、10 m、50 m 多个高度的风速分量,配合 PBLH 可减少工程师做轮毂高度(通常 80–150 m)垂直外推时的不确定性;不过需要清醒认识到:MERRA-2 并不原生提供 100 m 风速(这是 ERA5 的强项),轮毂高度风速仍需由 50 m 向上外推或借助 era5 获取。

关键结论

  1. MERRA-2 覆盖 1980 年至今,水平分辨率 0.5°×0.625°,垂直 72 层,时间分辨率最高逐小时,是目前时效性最长的高分辨率全球再分析之一。
  2. 首次将气溶胶同化(AOD assimilation)引入全球再分析,显著改善了气溶胶活跃地区(中东、南亚、北非、中国西部)的地表短波辐射(SWGDN)精度。
  3. 与第一代 MERRA 相比,MERRA-2 在全球平均温度趋势的一致性上有明显提升,减少了再分析因观测系统变迁引入的虚假趋势(spurious trends)。
  4. ERA5 在云和降水的整体表现上通常优于 MERRA-2,但 MERRA-2 在气溶胶同化方面的能力是 ERA5 所不具备的,两者在辐照评估场景下形成互补关系。
  5. MERRA-2 提供完整的地表辐射分量(SWGDN、LWGNT)及边界层、近地层诊断(PBLH、近地层风速),可支撑光伏电站的逐小时发电量模拟与风电资源的长序列统计分析。

以上第 1–4 点为 Gelaro 等(2017)原文报告的结论;第 5 点中的字段供给为数据集规格说明。工程取用时请以原文与官方数据规格为准。

对新能源 / 运梦平台的意义

对风电开发商而言,MERRA-2 最直接的价值在于提供长序列、稳定一致的近地层风速数据。国内大多数测风塔的运营时间不超过 3 年,而风资源的年际变率受 ENSO、NAO 等大尺度气候模态驱动,短期测风无法捕捉完整的年际波动。MERRA-2 从 1980 年起连续记录,可与测风塔数据做相关性回归,将短期测风序列订正到长期气候平均值(即 MCP 方法,Measure-Correlate-Predict)。需要注意的是,MERRA-2 近地层原生风速到 50 m 为止,做轮毂高度(80–150 m)评估时需由 50 m 外推;若项目对 100 m 原生风速有刚性需求,建议改用提供 100 m 风速的 era5,或将两套数据交叉验证。

对光伏开发商而言,MERRA-2 的气溶胶同化能力是选择 nasa 数据源的核心理由。中国西部(甘肃、青海、新疆)、中部(河南、山东)在春季沙尘季和冬季重污染期间气溶胶负荷明显升高,按大气辐射的一般规律,若使用未做气溶胶订正的辐照数据,GHI 估算容易系统性偏高,导致电站发电量预测虚高。MERRA-2 把 MODIS AOD 观测纳入同化,能在统计意义上更真实地还原这些时段的辐照衰减,从而降低 P50 发电量的系统性偏差风险。值得注意的是,即便有气溶胶同化,MERRA-2 在单次污染过程的逐小时精度仍有限,重要项目应将 MERRA-2 与地面辐射站或卫星衍生辐照产品做交叉验证。

对储能和综合能源项目而言,MERRA-2 提供的2 m 气温、近地层风速、总辐射等多气象要素同步输出,是构建多能互补发电量模拟模型的理想输入。在电网侧,历史气象与历史负荷数据的关联分析(如温度-负荷弹性系数估算)也需要长时间序列、统一格式的气象数据,MERRA-2 在这一场景下同样适用。运梦气象 API 已将 MERRA-2 的核心字段(近地层风速 ws/wd、地表辐射 rsds、2 m 气温 tas 等)标准化为统一 JSON 接口,开发者无需自行处理 NetCDF 文件,大幅降低了数据接入门槛。

需要特别强调的是:MERRA-2 是历史再分析,不提供未来预报。运梦平台中,预报场由 dataSourceId: "ger"(德国气象局)提供,两者在 API 层面使用不同的 dataSourceId 参数加以区分,请勿混用。历史资源评估选 "nasa",短期发电量预测选 "ger",是运梦平台推荐的标准用法。

在运梦气象 API 上手

调用运梦气象 API 获取 MERRA-2 历史数据非常简单:在请求体的 dataSourceId 字段填入 "nasa",指定坐标、时间范围和所需字段即可。以下示例展示如何获取某风电场(经度 98.5°E,纬度 39.2°N,甘肃河西走廊典型位置)2023 年整年的近地层风速与地表辐射数据,用于风光资源联合评估:

{
  "dataSourceId": "nasa",
  "lat": 39.2,
  "lon": 98.5,
  "stime": "2023-01-01 00:00",
  "etime": "2023-12-31 23:00",
  "fields": ["ws", "wd", "rsds", "dni", "tas"],
  "timezone": "8"
}

返回的 wswd 为近地层综合风速与风向;rsds 为地表向下短波辐射(W/m²,即 GHI);dni 为直接法向辐照度;tas 为 2 m 气温(°C,平台已做后处理转换)。需要特别注意的是:MERRA-2 的近地层风原生只到 50 m,它并不原生提供 100 m 风速——若评估轮毂高度(80–150 m)风况,需由 50 m 向上做垂直外推,或改用原生提供 100 m 风速的 era5。获取数据后,建议先做基础质控(去除异常值、检查缺测率),再与现场测风塔或辐照仪数据做相关性验证,确认偏差在可接受范围后再用于发电量评估。MERRA-2 历史数据覆盖 1980 年至今,建议优先拉取最近 20–30 年作为长期统计基准。

常见问题

MERRA-2 和 ERA5 应该选哪个? 两者在大多数地区精度相当,建议根据项目特点选择:若项目位于气溶胶活跃地区(中国西部、南亚、中东、北非),优先考虑 MERRA-2(nasa),因其气溶胶同化能力更强;若项目关注降水或云量,ERA5(era5)通常表现更优。有条件的项目可同时拉两套数据做交叉验证,取偏差较小的一套作为主数据源。

MERRA-2 的数据延迟是多少? MERRA-2 属于再分析产品,NASA 通常以滞后数月到一年的频率更新最新时段数据(即"near real-time"版本 MERRA-2 NRT 的延迟约数天,但精度低于正式版)。运梦 API 中的 nasa 数据源以正式归档版为主,一般覆盖到查询日期前数月。若需要最新历史数据,请通过运梦控制台确认当前数据截止时间。

MERRA-2 能直接拿到 100 m 轮毂高度风速吗? 不能。MERRA-2 的近地层单层诊断只提供 2 m、10 m、50 m 三个高度的风速分量(即 U2M/V2M、U10M/V10M、U50M/V50M),没有原生的 100 m 风速字段。这与 ERA5 形成鲜明对比——原生 100 m 风(u100/v100)恰是 ERA5 公认的强项、也是 MERRA-2 不具备的能力。因此用 MERRA-2 评估轮毂高度(80–150 m)风况时,需基于 50 m 风做垂直外推(如对数律或幂律),或直接改用 era5 获取原生 100 m 风速并做交叉验证。

MERRA-2 能用于海上风电评估吗? 可以。MERRA-2 的同化系统对海洋区域同样有效,海面散射计(如 QuikSCAT、ASCAT)风速观测被纳入同化,海上风速质量通常优于无测风塔参照的内陆偏远地区。但 MERRA-2 约 50 km 的水平分辨率对于近海地形复杂的海峡、岛礁区域仍然偏粗,建议结合中尺度数值模拟(如 WRF 降尺度)使用。

运梦 API 的 nasager 数据源有什么本质区别?nasa(MERRA-2)是历史再分析,只覆盖过去时段,适用于资源评估、长序列统计分析、MCP 订正等离线分析任务。ger(德国气象局)是数值天气预报,提供未来数天的预报,适用于发电量短期预测、调度计划制定等在线实时任务。两者底层模式、分辨率、更新机制完全不同,是互补而非替代关系。

引用与原文

Gelaro, R., McCarty, W., Suárez, M. J., Todling, R., Molod, A., Takacs, L., et al. (2017). The Modern-Era Retrospective Analysis for Research and Applications, Version 2 (MERRA-2). Journal of Climate, 30(14), 5419–5454. DOI: doi.org/10.1175/JCLI-D-16-0758.1