气象数据

Aurora 解读：大气基础模型与新能源气象应用

2024-03-18 · 南京运梦科技算法团队 · 评审算法负责人

过去几年，AI 气象领域出了一批"单点突破"的模型：GraphCast 做中期确定性预报、GenCast 做集合概率预报、Pangu-Weather 做三维大气。它们各自惊艳，但每一个都为一类任务专门训练。2025 年发表在 Nature 上的 Aurora 把问题往前推了一步——它借用大语言模型那套"先预训练、再微调"的思路，用一个统一的大气基础模型去同时覆盖天气、空气质量、海浪、台风路径等多类预测任务。对风电、光伏、电网功率预测这些既要风速辐射、又关心极端天气和空气质量的从业者来说，这种"一个底座、多个下游"的范式，值得认真读懂。

关键要点

Aurora 是 Microsoft Research 出品、2025 年发表于 Nature 的 13 亿参数地球系统基础模型，预训练数据超过一百万小时，代码与权重已在 GitHub 开源。
它借用大语言模型的"先大规模预训练、再轻量微调"范式，用同一套底座同时覆盖天气、空气质量、海浪、台风路径等异质任务。
在论文评测口径下，Aurora 在空气质量约 74%、海浪约 86%、台风路径 100%、高分辨率天气约 92% 的目标上优于对应业务系统，与 GraphCast 相比约 94% 的目标更优。
官方估计其出预报比 ECMWF 的 IFS 快约 5,000 倍量级，反映 AI 推理相对传统数值积分的速度差，而非取代物理模式。
对新能源团队的启示：用强泛化的预训练底座加本地少量历史数据做轻量微调，并把历史回测与实时预报的字段、单位、时空分辨率口径统一打通。

背景与定位

这篇论文的英文原题是 A Foundation Model for the Earth System，模型名字叫 Aurora；它的 arXiv 预印本（2405.13063）早期标题为 Aurora: A Foundation Model of the Atmosphere，后续随能力扩展改为"地球系统"。第一作者是 Cristian Bodnar 等人（Bodnar et al.），出品方为 Microsoft Research，正式版发表于 Nature（2025 年 5 月，第 641 卷）。

判断一篇文献是否值得花时间，通常看发在哪、谁做的、范式是否新。Aurora 三条都立得住。

期刊层级：Nature 是公认的顶级综合性期刊，AI 气象成果能进正刊本身就是一道高门槛筛子。
作者与出品方：Microsoft Research 在大模型工程上积累深厚，且 Aurora 的代码与权重已在 GitHub 开源，可复现、可微调，这让它的影响力远超"只能看不能用"的论文。
范式意义：在 GraphCast 等"专模专用"工作之后，Aurora 第一次把"基础模型"这一概念系统性地搬进大气科学——一次大规模预训练，多次小成本微调，复用同一套底座解决异质任务。

换句话说，它不是众多 AI 气象论文中的又一篇，而是把研究范式从"专用预报模型"推向"通用大气基础模型"的标志性工作之一。

方法 / 它做了什么

Aurora 的核心是一个 13 亿参数的大模型，骨干采用灵活的三维 Swin Transformer，配合 Perceiver 风格的编码器与解码器，使它能吞吐分辨率、变量、层次都不一样的异质输入。它的工作方式可以拆成两段来理解。

第一段是大规模预训练。 Aurora 在超过一百万小时的多源地球系统数据上做预训练，数据来源既包括再分析产品（如 ERA5 这类历史事实标准），也包括气候模拟和业务预报。海量且多样的数据让模型先学到一套通用的大气演变规律——这正是"基础模型"区别于专用模型的地方：底座见得多、泛化强。

第二段是面向任务的微调。 预训练完成后，针对具体下游任务（天气、空气质量、海浪、台风路径），用相对少量的数据做两阶段微调：先做短时效微调，再用 LoRA（低秩适配）这类轻量手段做长时效滚动微调。这套做法的好处在于：单个任务的微调成本远低于从头训练一个专用模型，对训练数据稀缺或变量异质的任务尤其友好。

驱动方式上，Aurora 与同类 AI 模型一致——以初始场为起点自回归滚动，把上一步输出当作下一步输入，逐步把预报推向未来。评测则在各任务上分别对照对应的业务基准系统。

关键结论

把论文已核实的要点提炼出来，最值得记住的有这么几条（数字均为论文及官方口径）：

Aurora 是一个 13 亿参数、预训练数据超百万小时的地球系统基础模型。它在高分辨率天气预报上工作于 0.1°（赤道附近约 11 公里） 网格，空气质量预报为 0.4° 分辨率、5 天时效。
多任务上均超越业务基准：在论文的评测口径下，Aurora 在空气质量约 74% 的目标、海浪约 86% 的目标、台风路径对比 7 家业务预报中心的 100% 测试、以及高分辨率天气约 92% 的场景上优于对应业务系统；与 GraphCast 相比，约 94% 的目标上更优。这些是"在特定评测口径下的胜率"，而非"全面碾压"。
效率优势显著：官方估计 Aurora 出预报比 ECMWF 的综合预报系统 IFS 快约 5,000 倍量级。需要强调，这是计算开销的数量级对比，反映 AI 推理相对传统数值积分的速度差，而非声称物理模式被取代。
预训练-微调范式可迁移：同一套预训练底座，经小成本微调即可适配空气质量、海浪、台风等异质任务，这是 Aurora 区别于单任务模型的最核心结论。

需要补充边界：上述胜率均依赖各任务选定的评测基准与指标口径，更换基准或指标，具体百分比会变化；AI 与物理模式在业务中更多是互补关系。

对新能源 / 运梦平台的意义

把这些结论落到风电、光伏、电网功率预测的实际工作流上，至少有三层意义。

第一，"一个底座、多个下游"契合新能源的多任务现实。 新能源运营从来不是只看风速辐射：风电要看风场与极端阵风，光伏要看辐射与气溶胶、空气质量，电网要看温度负荷与台风等极端事件。Aurora 这种用同一底座覆盖天气、空气质量、海浪、台风的范式，恰好对应新能源团队"多类气象信号要统一来源、统一口径"的诉求。

第二，预训练-微调降低了自建模型的门槛。 过去想做一个贴合本场站的专用预测模型，往往要堆大量标注与算力。基础模型范式提示了另一条路：复用强泛化的预训练底座，用本地少量历史数据做轻量微调即可贴合站点特性。这对风电功率预测与光伏功率预测的特征工程与建模都有直接借鉴。

第三，历史与预报数据的口径必须打通。 Aurora 在预训练里大量使用 ERA5 这类再分析数据，业务落地又要与实时预报源协同。新能源团队同样需要一套字段命名、单位、时空分辨率一致的数据通道，避免"历史回测用一套字段、实时预报用另一套字段"反复换名。这正是双数据源平台的价值——历史回测用 ERA5，预报用德国气象局预报，字段口径统一。关于 AI 气象范式的对比，也可参考 GraphCast 解读。

在运梦气象 API 上手

南京运梦科技的运梦气象 API 同时提供 ERA5 与德国气象局双数据源，字段统一通过 downloadSync 接口按 dataSourceId 与 fields 拉取，刚好对应 Aurora"历史预训练 + 预报应用"两类需求。

按场景选字段的常用思路：

风资源 / 风电功率：u100、v100、ws、wd
光伏辐射 / 光伏功率：rsds、dni、dhi
常规气象 / 偏差订正：tas、hurs、sp、pr

如果你想复刻 Aurora 的思路——拿 ERA5 长序列做模型预训练或回测，请求体大致是这样：

import os, requests

API = "https://console.yun-meng.top/api/energy-weather/search/weather/action/downloadSync"

payload = {
    "dataSourceId": "era5",                 # 历史预训练 / 回测真值
    "lat": 31.5, "lon": 118.5,              # 风电 / 光伏场址单点
    "stime": "1990-01-01 00:00",
    "etime": "2020-12-31 23:00",            # 长序列，供底座学习与微调
    "fields": ["u100", "v100", "ws", "wd", "rsds", "tas"],
    "timezone": "8",
}

resp = requests.post(API, headers={"Authorization": f"Bearer {os.environ['YUNMENG_TOKEN']}"},
                     json=payload, timeout=600)
resp.raise_for_status()
result = resp.json()
if not result.get("success"):
    raise RuntimeError(result.get("msg", "查询失败"))

data = result["data"]
print(len(data["timeList"]), data["u100"][0], data["rsds"][0])

如果转向预报场景，只需把 dataSourceId 换成 ger，并把时间窗调整到未来时效即可。字段含义、单位与完整定义见数据要素解释，接口参数以 API 参考文档为准。两条产品线的详情分别见 ERA5 产品页与德国气象局预报。

一点工程提醒

Aurora 的预训练-微调之所以高效，前提是底座吃下了海量且口径一致的历史数据。落到工程上，无论你是微调一个轻量预测模型，还是只做特征工程，先把历史气象的字段、单位、时区统一好，比急着上模型更重要——这也是基础模型范式给数据工程的隐性启示。

常见问题

Aurora 是什么？谁开发的？ Aurora 是一个 13 亿参数的地球系统基础模型，由 Microsoft Research 开发，第一作者为 Cristian Bodnar 等人，2025 年 5 月发表于 Nature 第 641 卷，代码与权重已在 GitHub 开源。

Aurora 和 GraphCast 有什么区别？ GraphCast 等是"专模专用"，每个模型只为一类任务训练；Aurora 则借用大语言模型的预训练-微调范式，用同一套底座同时覆盖天气、空气质量、海浪、台风路径等多任务。在论文评测口径下，Aurora 约 94% 的目标上优于 GraphCast。

Aurora 真的比传统数值预报快几千倍吗？ 官方估计 Aurora 出预报比 ECMWF 的综合预报系统 IFS 快约 5,000 倍量级。但这是计算开销的数量级对比，反映 AI 推理相对传统数值积分的速度差，并不意味着物理模式被取代——二者在业务中更多是互补关系。

Aurora 的高分辨率天气预报精度是多少？ 它在高分辨率天气预报上工作于 0.1° 网格（赤道附近约 11 公里），空气质量预报为 0.4° 分辨率、5 天时效。需注意各项胜率均依赖选定的评测基准与指标口径，更换基准或指标具体百分比会变化。

新能源功率预测如何借鉴 Aurora 的范式？ 可复用强泛化的预训练底座，用本场站少量历史数据做轻量微调以贴合站点特性，而非从头堆算力训练专用模型。前提是先把历史气象的字段、单位、时区与时空分辨率统一好——历史回测可用 ERA5、预报用德国气象局预报，字段口径保持一致。

引用与原文

Bodnar, C., Bruinsma, W. P., Lucic, A., Stanley, M., Vaughan, A., Brandstetter, J., et al. (2025). A Foundation Model for the Earth System (Aurora). Nature, 641, 1180–1187. Microsoft Research 出品并开源。

DOI：doi.org/10.1038/s41586-025-09005-y

arXiv 预印本（早期题为 Aurora: A Foundation Model of the Atmosphere）：arxiv.org/abs/2405.13063

相关阅读