进展:基于深度学习的热带气旋边界层参数化方案

热带气旋的生成、增强与大气边界层过程密切相关,但传统边界层参数化方案对热带气旋边界层湍流通量的预测仍然存在较大的不确定性。近年来,机器学习方法给数值模式的物理过程参数化带来了新的可能性。南京大学谈哲敏院士团队近期发展一种基于深度学习的热带气旋边界层参数化方案——DeepBLDeepBL具有一维卷积结构这使得神经网络对序列数据的变率非常敏感,同时也使得神经网络的可训练参数数量相比于全连接网络要大幅减少,训练的难度更低

作者首先使用WRF模式进行了理想热带气旋的大涡模拟。随后,利用盒式平均法对大涡模拟数据进行尺度分离,将其分为可分辨变量与湍流通量,分别作为深度学习模型的输入与输出。

训练数据中小湍流通量样本数量大,大湍流通量样本数量小。作者提出了一种非线性变换方法来预处理训练数据,以减缓这种数据不平衡性。非线性变换的表达式如下:


在使用DeepBL做预测的时候,整个过程会反过来进行DeepBL的输出会通过一个逆变换以恢复到原有值。这个逆变换具有如下表达式:

非线性变换可大幅降低训练集和验证集的数据不平衡性,方法训练出的DeepBL在验证集和测试集上的均方误差相比于在原始数据上训练的DeepBL更低(图2此外,DeepBL预测的湍流通量的均方误差相比于YSU方案要显著更低湍流通量的大小、空间分布也与大涡模拟诊断结果相一致(图2使用DeepBL正确预测湍流通量有助于提高模式对热带气旋的模拟能力。


1. 在非线性变换后的数据上训练的DeepBL在不同数据组上的相对均方误差分布。结果分别在上进行展示。图中的分析是在验证集或测试集(红线)上进行的。n代表着非线性变换中的指数。我们将验证集和测试集中每一个气柱分别按照分数大小在各自的数据集中按照从小到大排列。横坐标的0.1代表排序好的前10%的数据,0.2代表前10%20%的排序好的数据,以此类推。相对均方误差是指在非线性变换后的数据上训练的DeepBL的均方误差和在原始数据上训练的DeepBL的均方根误差的比值。

2. DeepBL方案(b, e, h, k)与YSU方案(c, f, i, l)预测的热带气旋边界层湍流通量分布与边界层大涡模拟a, d, g, j诊断的湍流通量分布的对比。湍流通量类型为动量通量(a-f)、感热通量(g-i)与水气通量(j-l)。


上述工作首次实现了深度神经网络在中尺度模式边界层参数化中的应用。该研究论文以"Deep Learning Parameterization of the Tropical Cyclone Boundary Layer"为题于20231月发表在期刊《Journal of Advances in Modeling Earth Systems》上。研究工作受到国家重点研发计划"台风强度/结构变化的关键动力-热力过程及预报理论研究"2017YFC1501601)资助。论文第一作者为南京大学大气科学学院博士毕业生王乐毅,通讯作者为南京大学谈哲敏院士

文章信息:

Wang, L.-Y., & Tan, Z.-M. (2023). Deep learning parameterization of the tropical cyclone boundary layer. Journal of Advances in Modeling Earth Systems, 15, e2022MS003034.

https://doi.org/10.1029/2022MS003034