Aurora 解读:大气基础模型与新能源气象应用

过去几年,AI 气象领域出了一批"单点突破"的模型:GraphCast 做中期确定性预报、GenCast 做集合概率预报、Pangu-Weather 做三维大气。它们各自惊艳,但每一个都为一类任务专门训练。2025 年发表在 Nature 上的 Aurora 把问题往前推了一步——它借用大语言模型那套"先预训练、再微调"的思路,用一个统一的大气基础模型去同时覆盖天气、空气质量、海浪、台风路径等多类预测任务。对风电、光伏、电网功率预测这些既要风速辐射、又关心极端天气和空气质量的从业者来说,这种"一个底座、多个下游"的范式,值得认真读懂。
关键要点
- Aurora 是 Microsoft Research 出品、2025 年发表于 Nature 的 13 亿参数地球系统基础模型,预训练数据超过一百万小时,代码与权重已在 GitHub 开源。
- 它借用大语言模型的"先大规模预训练、再轻量微调"范式,用同一套底座同时覆盖天气、空气质量、海浪、台风路径等异质任务。
- 在论文评测口径下,Aurora 在空气质量约 74%、海浪约 86%、台风路径 100%、高分辨率天气约 92% 的目标上优于对应业务系统,与 GraphCast 相比约 94% 的目标更优。
- 官方估计其出预报比 ECMWF 的 IFS 快约 5,000 倍量级,反映 AI 推理相对传统数值积分的速度差,而非取代物理模式。
- 对新能源团队的启示:用强泛化的预训练底座加本地少量历史数据做轻量微调,并把历史回测与实时预报的字段、单位、时空分辨率口径统一打通。
背景与定位
这篇论文的英文原题是 A Foundation Model for the Earth System,模型名字叫 Aurora;它的 arXiv 预印本(2405.13063)早期标题为 Aurora: A Foundation Model of the Atmosphere,后续随能力扩展改为"地球系统"。第一作者是 Cristian Bodnar 等人(Bodnar et al.),出品方为 Microsoft Research,正式版发表于 Nature(2025 年 5 月,第 641 卷)。
判断一篇文献是否值得花时间,通常看发在哪、谁做的、范式是否新。Aurora 三条都立得住。
- 期刊层级:Nature 是公认的顶级综合性期刊,AI 气象成果能进正刊本身就是一道高门槛筛子。
- 作者与出品方:Microsoft Research 在大模型工程上积累深厚,且 Aurora 的代码与权重已在 GitHub 开源,可复现、可微调,这让它的影响力远超"只能看不能用"的论文。
- 范式意义:在 GraphCast 等"专模专用"工作之后,Aurora 第一次把"基础模型"这一概念系统性地搬进大气科学——一次大规模预训练,多次小成本微调,复用同一套底座解决异质任务。
换句话说,它不是众多 AI 气象论文中的又一篇,而是把研究范式从"专用预报模型"推向"通用大气基础模型"的标志性工作之一。
方法 / 它做了什么
Aurora 的核心是一个 13 亿参数的大模型,骨干采用灵活的三维 Swin Transformer,配合 Perceiver 风格的编码器与解码器,使它能吞吐分辨率、变量、层次都不一样的异质输入。它的工作方式可以拆成两段来理解。
第一段是大规模预训练。 Aurora 在超过一百万小时的多源地球系统数据上做预训练,数据来源既包括再分析产品(如 ERA5 这类历史事实标准),也包括气候模拟和业务预报。海量且多样的数据让模型先学到一套通用的大气演变规律——这正是"基础模型"区别于专用模型的地方:底座见得多、泛化强。
第二段是面向任务的微调。 预训练完成后,针对具体下游任务(天气、空气质量、海浪、台风路径),用相对少量的数据做两阶段微调:先做短时效微调,再用 LoRA(低秩适配)这类轻量手段做长时效滚动微调。这套做法的好处在于:单个任务的微调成本远低于从头训练一个专用模型,对训练数据稀缺或变量异质的任务尤其友好。
驱动方式上,Aurora 与同类 AI 模型一致——以初始场为起点自回归滚动,把上一步输出当作下一步输入,逐步把预报推向未来。评测则在各任务上分别对照对应的业务基准系统。
关键结论
把论文已核实的要点提炼出来,最值得记住的有这么几条(数字均为论文及官方口径):
- Aurora 是一个 13 亿参数、预训练数据超百万小时的地球系统基础模型。它在高分辨率天气预报上工作于 0.1°(赤道附近约 11 公里) 网格,空气质量预报为 0.4° 分辨率、5 天时效。
- 多任务上均超越业务基准:在论文的评测口径下,Aurora 在空气质量约 74% 的目标、海浪约 86% 的目标、台风路径对比 7 家业务预报中心的 100% 测试、以及高分辨率天气约 92% 的场景上优于对应业务系统;与 GraphCast 相比,约 94% 的目标上更优。这些是"在特定评测口径下的胜率",而非"全面碾压"。
- 效率优势显著:官方估计 Aurora 出预报比 ECMWF 的综合预报系统 IFS 快约 5,000 倍量级。需要强调,这是计算开销的数量级对比,反映 AI 推理相对传统数值积分的速度差,而非声称物理模式被取代。
- 预训练-微调范式可迁移:同一套预训练底座,经小成本微调即可适配空气质量、海浪、台风等异质任务,这是 Aurora 区别于单任务模型的最核心结论。
需要补充边界:上述胜率均依赖各任务选定的评测基准与指标口径,更换基准或指标,具体百分比会变化;AI 与物理模式在业务中更多是互补关系。
对新能源 / 运梦平台的意义
把这些结论落到风电、光伏、电网功率预测的实际工作流上,至少有三层意义。
第一,"一个底座、多个下游"契合新能源的多任务现实。 新能源运营从来不是只看风速辐射:风电要看风场与极端阵风,光伏要看辐射与气溶胶、空气质量,电网要看温度负荷与台风等极端事件。Aurora 这种用同一底座覆盖天气、空气质量、海浪、台风的范式,恰好对应新能源团队"多类气象信号要统一来源、统一口径"的诉求。
第二,预训练-微调降低了自建模型的门槛。 过去想做一个贴合本场站的专用预测模型,往往要堆大量标注与算力。基础模型范式提示了另一条路:复用强泛化的预训练底座,用本地少量历史数据做轻量微调即可贴合站点特性。这对 风电功率预测 与 光伏功率预测 的特征工程与建模都有直接借鉴。
第三,历史与预报数据的口径必须打通。 Aurora 在预训练里大量使用 ERA5 这类再分析数据,业务落地又要与实时预报源协同。新能源团队同样需要一套字段命名、单位、时空分辨率一致的数据通道,避免"历史回测用一套字段、实时预报用另一套字段"反复换名。这正是双数据源平台的价值——历史回测用 ERA5,预报用德国气象局预报,字段口径统一。关于 AI 气象范式的对比,也可参考 GraphCast 解读。
在运梦气象 API 上手
南京运梦科技的运梦气象 API 同时提供 ERA5 与德国气象局双数据源,字段统一通过 downloadSync 接口按 dataSourceId 与 fields 拉取,刚好对应 Aurora"历史预训练 + 预报应用"两类需求。
按场景选字段的常用思路:
- 风资源 / 风电功率:
u100、v100、ws、wd - 光伏辐射 / 光伏功率:
rsds、dni、dhi - 常规气象 / 偏差订正:
tas、hurs、sp、pr
如果你想复刻 Aurora 的思路——拿 ERA5 长序列做模型预训练或回测,请求体大致是这样:
import os, requests
API = "https://console.yun-meng.top/api/energy-weather/search/weather/action/downloadSync"
payload = {
"dataSourceId": "era5", # 历史预训练 / 回测真值
"lat": 31.5, "lon": 118.5, # 风电 / 光伏场址单点
"stime": "1990-01-01 00:00",
"etime": "2020-12-31 23:00", # 长序列,供底座学习与微调
"fields": ["u100", "v100", "ws", "wd", "rsds", "tas"],
"timezone": "8",
}
resp = requests.post(API, headers={"Authorization": f"Bearer {os.environ['YUNMENG_TOKEN']}"},
json=payload, timeout=600)
resp.raise_for_status()
result = resp.json()
if not result.get("success"):
raise RuntimeError(result.get("msg", "查询失败"))
data = result["data"]
print(len(data["timeList"]), data["u100"][0], data["rsds"][0])
如果转向预报场景,只需把 dataSourceId 换成 ger,并把时间窗调整到未来时效即可。字段含义、单位与完整定义见 数据要素解释,接口参数以 API 参考文档 为准。两条产品线的详情分别见 ERA5 产品页 与 德国气象局预报。
一点工程提醒
Aurora 的预训练-微调之所以高效,前提是底座吃下了海量且口径一致的历史数据。落到工程上,无论你是微调一个轻量预测模型,还是只做特征工程,先把历史气象的字段、单位、时区统一好,比急着上模型更重要——这也是基础模型范式给数据工程的隐性启示。
常见问题
Aurora 是什么?谁开发的? Aurora 是一个 13 亿参数的地球系统基础模型,由 Microsoft Research 开发,第一作者为 Cristian Bodnar 等人,2025 年 5 月发表于 Nature 第 641 卷,代码与权重已在 GitHub 开源。
Aurora 和 GraphCast 有什么区别? GraphCast 等是"专模专用",每个模型只为一类任务训练;Aurora 则借用大语言模型的预训练-微调范式,用同一套底座同时覆盖天气、空气质量、海浪、台风路径等多任务。在论文评测口径下,Aurora 约 94% 的目标上优于 GraphCast。
Aurora 真的比传统数值预报快几千倍吗? 官方估计 Aurora 出预报比 ECMWF 的综合预报系统 IFS 快约 5,000 倍量级。但这是计算开销的数量级对比,反映 AI 推理相对传统数值积分的速度差,并不意味着物理模式被取代——二者在业务中更多是互补关系。
Aurora 的高分辨率天气预报精度是多少? 它在高分辨率天气预报上工作于 0.1° 网格(赤道附近约 11 公里),空气质量预报为 0.4° 分辨率、5 天时效。需注意各项胜率均依赖选定的评测基准与指标口径,更换基准或指标具体百分比会变化。
新能源功率预测如何借鉴 Aurora 的范式? 可复用强泛化的预训练底座,用本场站少量历史数据做轻量微调以贴合站点特性,而非从头堆算力训练专用模型。前提是先把历史气象的字段、单位、时区与时空分辨率统一好——历史回测可用 ERA5、预报用德国气象局预报,字段口径保持一致。
引用与原文
Bodnar, C., Bruinsma, W. P., Lucic, A., Stanley, M., Vaughan, A., Brandstetter, J., et al. (2025). A Foundation Model for the Earth System (Aurora). Nature, 641, 1180–1187. Microsoft Research 出品并开源。
DOI:doi.org/10.1038/s41586-025-09005-y
arXiv 预印本(早期题为 Aurora: A Foundation Model of the Atmosphere):arxiv.org/abs/2405.13063