未央网 07-08
AI大模型在巨灾风险预测中的应用及发展趋势分析 ——以气象领域为例
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

近年来,随着 OpenAI 等头部 AI 大模型企业的快速发展及全球算力的大幅提升,AI 大模型技术已广泛应用各个领域,并从办公、零售、客服、金融、营销等基础领域进一步向实体经济场景不断拓展。如智能家居、智能交通、智慧城市、工业制造、智慧医疗等行业,AI 大模型可以为用户提供智能交通调度、智慧医疗诊断、智能排产、智慧电网等更加深度的行业解决方案,从更底层的服务与基础设施层面赋能社会经济发展。与此同时,在传统的巨灾风险预测预报场景中,如极端天气预报、洪水预测、台风路径预测等领域,仍在大量应用各类基于物理规则的数值模型,基于 CPU 的串行计算逻辑消耗了大量的计算资源,预测能力也存在明显瓶颈。

在这样的背景之下,部分企业、高校、科研机构等开始尝试将 AI 大模型技术应用于巨灾风险的预测、预警及评估之中,特别是在天气及气象的预报预测等领域中,涌现出了一大批具有良好应用效果的模型,如华为 Panggu 模型、Google DeepMind 的 DGMR 模型、中国气象局与清华大学联合研发的 NowCastNet 模型、中国气象局风清、风雷、风顺模型、复旦大学 Fengwu 模型、ECMWF 的 AIFS 模型、Google 的 NeuralGCM 模型等等,这些模型总体上达到甚至超越了传统数值模型的预测效果,同时,由于其基于 GPU 的并行计算架构,预测所消耗的资源仅为传统数值模型的成千上万分之一;此外,在洪水预测、地震波监测等领域,国内国外相关企业与机构也相继发布了专有的 AI 大模型,取得了较好的效果。本文以气象领域 AI 大模型的主要应用为例,分析 AI 大模型在巨灾风险预测中的应用及发展趋势。

一、AI 大模型进步迅速,能力已接近人类

当前,随着 AI 大模型参数规模的不断增长、算法的不断改进、算力的不断增强,AI 大模型已具备强大的自然语言处理、图像 / 视频处理、语音识别能力,最新 AI 大模型已拥有类似于人类的深度思考能力,并在物理、化学、数学等众多领域媲美甚至超越人类博士生水平。

基于深度神经网络的 AI 大模型结构示意

在由真实世界软件任务组成的 SWE-Bench Verified 基准测试中,OpenAI o3 模型的准确率为 71.7%,这意味着它已经能够理解、设计和实现复杂的软件系统。在全球知名编程竞赛 Codeforces 中,o3 可以达到 2727 的分数,超越 99.99% 的人类水平。

在部分基准测试中,AI 大模型能力已超越人类

在数学竞赛 AIEM 2024 中,o3 准确率达到 96.7%。GPQA Diamond(博士级科学考试)是生物学、物理学和化学领域专家编写的高难度多项选择题数据集,主要评估人工智能系统在复杂问题上的表现。 而这些领域的博士专家,大约也只能达到专业范围内的 70% 准确率,o3 拿到了 87.7% 的钻石级成绩,其表现远高于人类专家的表现。有观点认为,随着 AI 大模型能力的不断提升,通往通用人工智能(AGI)之路已无技术障碍。

与此同时,AI 大模型在各行各业的应用与渗透也在快速进展中,其中,办公、零售、科研、医疗、工业制造、金融、气象等行业已对 AI 大模型进行了广泛而深入的探索,取得了良好的效果,根据部分研究机构的判断,AI 大模型有望在未来 3-5 年内在主要行业内取得良好的成熟度与市场变现能力。

亿欧智库对 AI 大模型在各行业应用的技术成熟度及时长变现能力的评估

在不断拓展行业应用的同时,AI 大模型的落地场景也正从浅层次的客服对话、文本生成等向供应链管理、医疗、质检等核心业务环节渗透,AI 大模型有望成为新型生产力基础设施,赋能千行百业。

二、AI 大模型在气象领域的应用

短期天气的预报和中长期气候变化的预测,是巨灾风险管理中的重要领域,包括对台风路径、极端降水、短时大风、极端高温、气温变化等的预测,这些预测预报对保险企业及客户做好风险管理及应对有着重大的现实意义。

(一)传统的数值天气预报

数值天气预报(Numerical Weather Prediction,NWP)是气象预报的制作不可缺少的重要基础和手段,其基于大气科学理论,以大气运动方程组为基础,利用超级计算机对大气状态进行数值模拟,通过给定初始条件和边界条件,计算出未来不同时刻的气象要素值,如温度、湿度、气压、风速等。

地球大气环境示意

1950 年,普森林顿大学首次尝试使用第一台电子计算机进行了天气预报。1954 年,在斯德哥尔摩首次实现了实时的天气预报。数值预报需要基于天气初始场,利用大气运动方程的近似表示进行数量庞大的计算。以欧洲中期天气预报中心(ECMWF)的预报为例,0.125 ° *0.125 °(间距约 15 公里)分辨率,垂直方向从地面到中间层(地面以上约 80 公里)划分为 91 层,使用数小时到数天的时间窗,每一个水平层有 200 万个个点,以 10 分钟为步长进行 10 天的预报,相应的集合预报中有 50 个集合成员,每天大约需要有 400 多亿个格点柱的运算需要计算。

在过去的近一个世纪里,尤其是最近的 20~30 年以来,数值天气预报取得了迅速的发展,数值天气预报已成为对气象进行预报的主流技术,其可以提供十几小时的短时天气预报、1~3 天的短期天气预报、3~10 天的中期天气预报以及月季年短期气候预测,同时,利用数值预报模式预报台风、暴雨已经成为可能,数值预报模式和物理过程参数化方案不断完善,数值预报水平在不断提高。

目前,传统的数值天气预报(NWP)已具有非常好的短期预报准确率,但其本质上还是让超级计算机去求解非常复杂的方程组来模拟大气运动,从而预测未来一定时间内的大气运动状态和天气气象,并在其基础上进行人工经验的修正,这种模式仍然存在一定的局限性和面临诸多挑战:一是初始场对预测准确性影响大,在 NWP 方式中,初始场非常重要,要将非常精确的实时天气初始值输入到超级计算机中,但由于观测数据的时空分辨率仍然有限,在一些偏远地区和海洋区域,观测站点稀疏,数据获取困难,这也影响了预报的准确性;二是多因素相互作用影响复杂,在现实中,大气环境是一个高度复杂的非线性系统,其变化受到多种因素的影响,产生一系列连锁反应,如太阳辐射、地球自转、海陆分布、地形地貌等,这些因素的相互作用使得气象现象具有很强的不确定性,难以完全准确地预测;三是传统数值预报的成本非常高。全球超过 180 个气象建模中心采用强大的高性能计算(HPC)基础设施来运行传统的数值天气预报(NWP)模型,其中包括欧洲中期天气预报中心(ECMWF),该中心运行在 983,040 个 CPU 核心上,以及英国气象局的超级计算机,该计算机采用超过 150 万个 CPU 核心,耗电量为 2.7 兆瓦特。数值预报每次预报所耗费的时间较长,难以高频率地进行预测,特别是如果要将分辨率提高,计算时间可能要显著翻倍。

(二)AI 大模型在气象领域的探索

在天气预报及气象预测领域,根据预报 / 预测周期的长短,可划分为短临气预报、中期天气预报及次季节 / 季节尺度预测几类,不同时间周期的 AI 大模型具有不同的预报 / 预测颗粒度,能够帮助保险公司及承保标的做好风险定价、风险预警、风险防范、风险处置等工作。针对传统数值模型存在的预测成本高、计算复杂等问题,AI 大模型在不同的时间尺度上均进行了尝试和探索,取得了良好的效果,部分模型已在气象部门开展业务化运行,为气象部门做好相关工作提供了有价值的参考。

短临天气预报 AI 大模型

0~2 小时的预报称为临近预报,2~12 小时的预报称为短时预报,短临天气预报主要聚焦在未来数小时内局部区域的降水、暴风等的预测,可以用于巨灾风险过程中的风险预警与防灾减灾,传统 NWP 数值天气预报在 2 小时内的天气预报准确率会显著下降。Google DeepMind 等商业公司和牛津大学、清华大学、中山大学等国内外高校近年来将人工智能技术应用于短临降水预报中,取得了良好的效果,成为短临降水预报的有效补充手段。

常见短临期天气预报 AI 大模型

目前,常见的短临天气预报 AI 大模型主要用于对短期内的降水情况进行预报,基于历史雷达观测数据进行训练,分辨率一般较高,空间分辨率可达到 1km*1km,时间分辨率可以达到 2-6 分钟;在核心算法方面,短临天气预报 AI 大模型大多采用 U-Net,另有部分模型采用类似生成式对抗网络 GAN 及 Transformer 的算法。同时,在短临天气预报领域,越来越多的模型将数据驱动与物理规律相结合,以求取得更好的预测结果。

常见短临期天气预报 AI 大模型要素对比

以 NowCastNet 模型为例,2023 年,清华大学软件学院与国家气象中心、国家气象信息中心提出 NowcastNet 极端降水临近预报大模型,并已在国家气象中心短临预报业务平台(SWAN 3.0)部署上线,将为全国极端降水天气短临预报业务提供支撑。NowCastNet 使用了来自美国 MRMS 数据 2016 年至 2021 年 6 年范围内空间网格分辨率 0.01 ˚、时间分辨率为 10 分钟的雷达观测资料完成了模型的预训练,并在中国雷达数据(2019.9.1-2021.3.31)上进行微调训练,并在 2021.4.1-6.30 数据上进行测试。

对比同为生成模型的 DGMR,以及 PredRNN、PySTEPS 等方法,评价指标采用 CSI 和 PSD,该方法大幅领先国际上的同类方法,在 71% 的案例中排名第一,研究成果已在 Nature 发表。

NowCastNet 模型架构

NowcastNet 模型是一个基于物理条件的深度生成模型,包括一个随机生成网络和一个确定性演变网络,其核心是端到端建模降水物理过程的神经演变算子,将物理演变与条件学习相结合,通过神经网络进行端到端的学习,以最优化预测误差,从而提高对极端降水的预测性能,NowCastNet 首次将降水临近预报时效延长到了 3 小时,可以在 2048km*2048km 的区域产生高分辨率的预报。

NowcastNet 对中国强降水的准确预报

2021 年 5 月 14 日 23 时 40 分,中国江淮地区出现强降水过程,湖北、安徽等多个地区发布了暴雨红色预警,NowcastNet 可以准确预测出三个强降水超级单体的变化过程。

NowcastNet 对美国强降水的准确预报

2021 年 12 月 11 日 9 时 30 分,美国中部地区突发龙卷风灾害,造成 89 人死亡、676 人受伤,NowcastNet 可以对强降水的强度、落区和运动形态等给出更清晰、更准确的预报结果。

中期天气预报 AI 大模型

中期天气预报是对未来于 4 至 10 天内天气变化趋势的预报。传统的中期天气预报一般是基于数值预报(NWP)方式开展的,欧洲中期天气预报中心(ECMWF)、中国气象局(CMA)、全球预报系统(GFS)等均发布了自己的中期天气预报产品。近年来,中期天气预报 AI 大模型大量涌现,常见的模型包括谷歌 DeepMind 的 GraphCast、华为云的 Pangu-Weather(盘古)、阿里巴巴的 SwinVRNN、复旦大学开发的 Fuxi(伏羲)、上海人工智能实验室的 Fengwu(风乌)、英伟达 Nvidia 的 FourCastNet,以及欧洲中期天气预报中心(ECMWF)的 AIFS 模型等,这些模型利用最新的人工智能和机器学习技术,显著提升了中期天气预报的准确性和细节层面的分析能力。

常见中期天气预报 AI 大模型

数据驱动的基于 AI 大模型的中期天气预报是研究非常活跃的应用领域,自 2018 年以来,众多研究机构、企业基于不同的 AI 大模型,推出了自己的天气预报模型,已实现了与传统数值预报相当甚至更好的预报准确率与分辨率。

中期天气预报 AI 大模型领域研究活跃

目前,常见的中期 AI 天气预报主要用于对 5 个地表变量 +5 个大气变量进行预报,空间分辨率一般为 0.25 ˚ *0.25 ˚,部分可以达到 0.09 ˚ *0.09 ˚,时间分辨率方面一般为 6 小时;大多数采用数据驱动作为模型内核,少数模型开始探索将数据驱动与物理规则相结合;在核心算法方面,不同改进形式的 Transformer 是主流,少数采用 GNN 作为核心算法,训练数据方面,大多采用 ERA5 再分析数据,少数国产模型采用国产 CRA-40 再分析数据,另有部分模型开始探索使用直接观测数据进行训练。

常见中期天气预报 AI 大模型要素对比

以华为推出的盘古气象大模型为例,盘古气象大模型是由华为于 2023 年提出的一种新的高分辨率全球 AI 气象预报系统,盘古气象大模型借助创新的 3DEST(3D Earth-Specific Transformer)网络结构,精准获取了地球上每一个经纬度的气象天气要素,共训练了 4 个模型,分别为 1 小时间隔、3 小时间隔、6 小时间隔、24 小时间隔模型。为训练每个模型,研究者使用 1979-2017 年的 ERA5 气象再分析数据进行了训练,模型共有 6400 万个参数量。

盘古气象大模型 3DEST 模型架构

盘古气象大模型是首个精度超过传统数值预报方法的 AI 方法,相关研究论文于 2023 年 7 月 6 日登上《Nature》,目前,华为盘古气象大模型已实现在欧洲中期天气预报中心(ECMWF)实现业务运行。盘古气象大模型 1 小时 -7 天预测精度均高于传统数值方法(即欧洲气象中心的 operational IFS),同时,在单个 V100 GPU 上,仅用 1.4 秒即可完成对全球的 24 小时天气预报,包括位势、湿度、风速、温度、海平面气压等,预测速度提升 10000 倍。

盘古气象大模型在主要指标上的预测结果

盘古气象大模型的水平空间分辨率达到 0.25 °× 0.25 ° ,时间分辨率为 1 小时,覆盖 13 层垂直高度,可以精准地预测细粒度气象特征,并且保留了大量细节帮助人们进一步了解极端天气。作为基础模型,盘古气象大模型还能够直接应用于多个下游场景。

在对 ERA5 再分析数据的确定性预测中,Pangu-Weather 在所有测试变量上均表现出色。相比世界上最好的数值天气预报系统 ECMWF 的业务集成预报系统(IFS)和 FourCastNet,Pangu-Weather 的均方根误差(RMSE)更低,异常相关系数(ACC)更高。例如,在 5 天的 Z500(500 hPa 位势高度)预报中,Pangu-Weather 的 RMSE 为 296.7,低于 IFS 的 333.7 和 FourCastNet 的 462.5。

不同高空和地面变量整体预测结果,盘古气象大模型均超越 operational IFS 和 FourCastNet

热带气旋追踪方面,盘古气象大模型显著超越 ECMWF-HRES

在追踪热带气旋等极端天气事件方面表现优秀,通过寻找海平面气压(MSLP)的局部最小值,算法在追踪 2018 年的 88 个命名热带气旋时达到了较高的精度。

中期天气预报是当前气象领域 AI 大模型应用研究最为活跃,也是各类 AI 大模型最多的领域,Google Research 的 Weather Bench2 项目,对主要的中期天气预报产品进行了评测对比,从地表数据、高空数据两个方面,对市场上主流模型的预测能力进行了评测对比,从评测结果可以看到,AI 大模型预测能力已达到甚至超越传统数值模型。

地表数据预测情况                   高空数据预测情况    

次季节 / 季节气象预测 AI 大模型

次季节 - 季节尺度(Sub-seasonal to Seasonal, S2S)预测是指对未来两周到两个月(即 15 到 60 天)内的天气和气候进行预测。这种预测介于常规的天气预报和季节预测之间,能够提供更长时间尺度的天气变化信息气象预报,S2S 预测面临很多技术难题,简单的沿着天气预报大模型的思路延长预报时长,并不能带来超过传统数值预报模式的技巧提升。

2013 年 WMO 联合世界天气研究计划和世界气候研究计划联合发起季节内到季节尺度预测计划 ( S2S ) ,目的是在中期天气预报(两周)和气候预测(季度)之间架起一座桥梁,实现天气气候一体化的无缝隙预报。S2S 也是我国防灾减灾和气象服务的一个重大的需求。

常见的次季节 - 季节尺度气象 AI 预测模型主要有微软的 DLWP、谷歌的 NeauralGCM 和清华大学与中国气象局联合研发的风顺大模型等。

常见次季节 / 季节气象预报 AI 大模型

目前,常见的次季节 - 季节气象预测 AI 大模型一般预测从数周到数月的气象状况,部分模型开始探索将数据驱动与物理规则相结合;训练数据方面,大多采用 ERA5 再分析数据,少数国产模型采用国产 CRA-40 再分析数据。

常见次季节 / 季节气象预测 AI 大模型要素对比

以 Google 发布的次季节 / 季节尺度气象预测 AI 大模型 NeuralGCM 为例,NeuralGCM 是 Google 于 2024 年提出的一种新的将物理建模与人工智能相结合的大气环流模型,其能够快速、准确地模拟地球大气,在模拟效率方面,比传统模型高出 10 万倍。这个模型结合了机器学习和物理方法,能进行中短期的天气预报以及几十年的气候模拟。

对于 2-15 天的天气预报,NeuralGCM 比最先进的物理模型更加准确;对于气候尺度的预测方面,NeuralGCM 也优于最先进的大气模型,在对 1980-2020 年间全球气温预测中,NeuralGCM 的 2.8 ˚ 确定性模型的平均误差是大气模型(AIMP)误差的 1/3。在 2020 年的气候模拟期间,NeuralGCM 还成功预测了热带气旋模式,这些模式与当年在相同区域观察到的风暴数量和强度相匹配,NeuralGCM 是第一个能够生成此类模式的基于机器学习的模型。

NeuralGCM 将机器学习算法结合了传统的物理建模,不再依赖科学家制定的参数化近似值来模拟小尺度天气变化,而是使用神经网络从现有天气数据中学习这些事件的物理原理,大大提高了模拟的准确性和效率。NeuralGCM 用 JAX 从头重写了大规模过程的数值求解器,它可以在 TPU 和 GPU 上高效运行,而传统的气候模型大多在 CPU 上运行。

NeuralGCM 成功预测热带气旋模式

相比于高分辨率的大气模型 X-SHiELD,NeuralGCM 的 1.4 ° 确定性模型在预测 2020 年的湿度和温度数据时误差减少了 15-50%,同时,其 1.4 ° 模型比 X-SHiELD 快 3500 多倍,这意味着如果研究人员用 X-SHiELD 模拟一年的大气,需要 20 天,而用 NeuralGCM 只需 8 分钟。总体而言,使用 NeuralGCM 进行气候模拟的计算成本比 X-SHiELD 低 10 万倍。

三、AI 大模型在巨灾风险模型中的应用趋势

当前,AI 大模型在巨灾风险模型中已得到了广泛的应用,特别是在气象领域,涌现出了一大批优秀的模型及研究成果。以气象领域为例看,AI 大模型在巨灾风险模型中的应用呈现出以下的趋势:

(一)广泛业务化运行。中国气象局推出的覆盖短临期、中期、次季节 / 季节尺度的天气预报、气象预测 AI 大模型风雷、风清、风顺,已于 2024 年陆续上线业务化运行,ECMWF(欧洲中期天气预报中心)推出的 AI 天气预报模型 AIFS 的首个业务化运行版本 AIFS Single v1.0 正式投入运行,与传统的基于物理过程的集成预报系统(IFS)并行运行。AIFS Single 每天与 ECMWF 基于物理的数值天气预报 ( NWP ) 模型并行运行四次,预报结果通过 ECMWF 的开放数据平台向公众开放。

(二)AI 大模型与数值模型双向融合。部分数据驱动的天气预报 AI 大模型已开始向模型中引入物理约束,并取得了良好的效果,如 NowCastNet、风清、风雷、风顺、NeuralGCM 等;与此同时,部分数值气象预报模型也开始将 AI 大模型的一些算法加入到计算过程中以加速计算过程。数据驱动的 AI 大模型与传统数值模型之间有逐步走向融合的趋势。

(三)对再分析数据的依赖逐步降低。当前,主流的中期天气预报 AI 大模型的训练及推理数据基础主要依赖于经过同化的各类再分析数据,如 ERA5、CRA-40 等,这降低了 AI 大模型的适用场景,部分模型已开始尝试使用原始数据进行模型的训练及推理,降低对再分析数据的依赖,这有望进一步扩大 AI 大模型的应用范围。

总的来看,近年来,AI 大模型技术发展非常迅速,在巨灾风险预测领域得到了广泛的应用,特别是在本文关注的气象领域,实现了以远低于原有数值模型的成本实现接近甚至超越原模型的预测效果,这为保险公司更好预测巨灾风险、降低灾害损害、评估灾害损失提供了强有力的工具,具有巨大的发展空间。

参考文献:

1.REICHSTEIN, Markus, et al. Early warning of complex climate risk with integrated artificial intelligence. Nature Communications, 2025, 16. Jg., Nr. 1, S. 2564.

2.CAMPS-VALLS, Gustau, et al. Artificial intelligence for modeling and understanding extreme weather and climate events. Nature Communications, 2025, 16. Jg., Nr. 1, S. 1919.

3.MCNORTON, Joe Ramu, et al. A global probability ‐ of ‐ fire ( PoF ) forecast. Geophysical Research Letters, 2024, 51. Jg., Nr. 12, S. e2023GL107929.

4.GIRONA, T á rsilo; DRYMONI, Kyriaki. Abnormal low-magnitude seismicity preceding large-magnitude earthquakes. Nature Communications, 2024, 15. Jg., Nr. 1, S. 7429.

5.CHANTRY, Matthew, et al. AIFS-ECMWF's Data-Driven Forecasting System. In: 105th AMS Annual Meeting. AMS, 2025.

6.RAVURI, Suman, et al. Skilful precipitation nowcasting using deep generative models of radar. Nature, 2021, 597. Jg., Nr. 7878, S. 672-677.

7.CHEN, Kang, et al. Fengwu: Pushing the skillful global medium-range weather forecast beyond 10 days lead. arXiv preprint arXiv:2304.02948, 2023.

8.PATHAK, Jaideep, et al. Fourcastnet: A global data-driven high-resolution weather model using adaptive fourier neural operators. arXiv preprint arXiv:2202.11214, 2022.

9.LAM, Remi, et al. Learning skillful medium-range global weather forecasting. Science, 2023, 382. Jg., Nr. 6677, S. 1416-1421.

10.ANDRYCHOWICZ, Marcin, et al. Deep learning for day forecasts from sparse observations. arXiv preprint arXiv:2306.06079, 2023.

11.KOCHKOV, Dmitrii, et al. Neural general circulation models for weather and climate. Nature, 2024, 632. Jg., Nr. 8027, S. 1060-1066.

12.ZHANG, Yuchen, et al. Skilful nowcasting of extreme precipitation with NowcastNet. Nature, 2023, 619. Jg., Nr. 7970, S. 526-532.

13.BI, Kaifeng, et al. Accurate medium-range global weather forecasting with 3D neural networks. Nature, 2023, 619. Jg., Nr. 7970, S. 533-538.

14.NEARING, Grey, et al. Global prediction of extreme floods in ungauged watersheds. Nature, 2024, 627. Jg., Nr. 8004, S. 559-563.

15. 汪海涛 , et al. 国内 AI 中期天气预报大模型进展及面临的挑战 . Computer Science and Application, 2024, 14. Jg., S. 196.

本文系未央网专栏作者 :肖 达 发表,内容属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 效果 智慧医疗 google 物理
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论