清华新闻网6月15日电 近日,清华大学软件学院王建民教授、龙明盛副教授团队提出了全球自动气象站预报大模型,首次实现了使用统一深度模型完成全球范围内数万自动气象站的协同预报,可以为近地面气象要素提供高精度的短期预报结果,同时自动推理不同尺度区域内的天气过程,为气象科学发现提供了全新的数据驱动范式。
气象预报与人民生产生活息息相关,长久以来受到科学界的广泛关注,但是由于天气系统自身的混沌特性,经典的大气物理方程模拟在小尺度、近地面预报中存在诸多问题。自动气象站部署在全球典型位置,能够以可控精度采集近地面时序数据,所需费用远低于雷达和卫星,是气象预报业务迈向精细化的必经之路。目前全球各地离散分布着数十万台自动站,以分钟粒度实时记录全球的气象变化。然而,实现全球自动站的协同预报极具挑战,一方面需要从自动站构建的部分可观测系统中挖掘全球整体的大气变化规律,另一方面也需要克服海量实时数据带来的巨大计算开销。
为解决这一问题,研究团队提出了全球自动气象站预报大模型Corrformer。通过对经典的随机过程理论进行拓展,设计了替代注意力机制的多相关机制,将空间互相关和时间自相关统一到可学习的多尺度树型结构中,用以建模全球离散自动站多维时序数据之间复杂的时空相关性。同时,该模型可以准确挖掘特定区域内不同自动站观测之间的相对延迟,进而推理出天气过程的传播路径,实现可解释气象预报。
得益于上述设计,Corrformer模型成功将时空建模中的双二次复杂度降低到空间建模的线性复杂度和时间建模的对数线性复杂度,从而在统一的深度模型中实现数万台自动气象站的协同预报。Corrformer仅使用一块图形处理器(GPU)训练一天即可完成模型优化,并能在一秒内生成全球近地面气象要素的短期预报,从而能够快速进行模型的更新迭代和业务部署。
此外,该模型还可以根据气象观测数据自动推理天气系统的传播方向,从而为预报结果提供可解释依据。如下图所示,模型准确捕捉了由于地球自转造成的全球温度变化,以及北欧受到山脉阻隔形成的“之字形”独特天气。模型的这一特性也为发现气象科学的新知识提供了完全数据驱动的新范式。
该模型在全球、区域和城市范围内均可以提供高可信度和高技巧性气象预报,同时在近地面预报中超越了经典的统计方法、先进的深度模型和业务广泛使用的数值预报方法。软件学院团队与国家气象中心合作推进模型的业务化,已在2022北京冬奥会气象保障中得到了成功应用,为全部比赛场馆提供了分钟级实时滚动更新的极大风和温度预报,有效支撑了高山滑雪、大跳台、短道速滑等多个比赛项目的赛程规划。未来,该模型将有力支撑我国近地面实况观测预报业务,为系列重大专项活动提供精细化气象保障。
研究成果以“统一深度模型实现全球自动站可解释气象预报”(Interpretable Weather Forecasting for Worldwide Stations with a Unified Deep Model)为题发表在《自然·机器智能》(Nature Machine Intelligence)上。
软件学院大数据软件团队博士生吴海旭、周航分别为论文的第一和第二作者,王建民教授和龙明盛副教授为论文的通讯作者。研究得到国家自然科学基金创新研究群体项目、优秀青年科学基金项目、国家重点研发计划项目和大数据系统软件国家工程研究中心的支持。
论文链接:
https://www.nature.com/articles/s42256-023-00667-9
供稿:软件学院
题图设计:梁晨
编辑:李华山
审核:郭玲
2023年06月15日 14:02:04
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)