基于卷积神经网络的集合Kalman滤波适应性局地化
集合Kalman滤波利用集合预报采样估计背景误差协方差,但由此估计的流依赖背景误差协方差会受到有限集合数量的样本误差影响,得到虚假不真实的相关和同化更新、进而导致滤波发散。解决滤波发散的常用办法之一是协方差局地化,其通常为一随距离递减的函数,将其乘上集合Kalman滤波的增益矩阵,即可得到局地化后的增益矩阵,远距离的虚假相关得到消除;但该方式可看作为一简单的线性滤波。为在减小样本误差对背景误差协方差影响的同时有效捕捉小尺度、非线性的相关性,本研究创新地提出了两种基于卷积神经网络(CNN)的局地化方法,一种最小化Kalman增益矩阵的采样误差(CNN-based localization function; CLF),另一种则最小化模式状态变量的后验误差(CNN-based empirical localization function; CELF)。不同于传统的参数化、半参数化的局地化方法,这两种基于CNN的局地化方法无需先验假设,可直接从数据中学得误差协方差的非线性关系,进而得到随时间和空间变化的、非对称的局地化函数。
通过学习基于大样本集合估计所得的背景误差协方差和实际有限集合样本估计所得的背景误差协方差,CLF可从有限集合样本估计的Kalman增益矩阵去逼近由大样本集合样本估计的 "真实"的Kalman增益矩阵。相对于CLF,CELF则从模式状态变量出发,学习由有限集合样本估计的Kalman增益矩阵、状态变量的先验集合平均以及真值(或者观测),估计的Kalman增益矩阵可使得后验集合平均逼近真值(或者观测)。利用具有快、慢尺度的Lorenz(2005)模式III,在不同模式误差、不同观测类型情况下,对于最优的传统局地化函数(GC)、适应性的局地化方法(LRLF、ELF)、基于CNN的局地化方法(CLF、CELF)进行了测试。结果表明,基于CNN的局地化方法相对于最优的GC局地化和对应的适应性局地化方法,均可更好地捕捉Kalman增益矩阵的结构,得到的Kalman增益矩阵误差、先验和后验模式状态变量误差也更小(图1和2)。
上述工作以"Convolutional Neural Network-Based Adaptive Localization for an Ensemble Kalman Filter"发表在《Journal of Advances in Modeling Earth Systems》上,研究工作受到国家自然科学基金42192553,41922036和41775057、关键地球物质循环前沿科学中心基金JBGS2102和中央高校基本科研基金0207-143801995和0209-14380097的资助。论文第一作者为南京大学大气科学学院硕士生王仲睿,通讯作者为南京大学雷荔傈教授,合作作者包括NCAR Jeffery L. Anderson,南京大学谈哲敏院士和南京大学张熠副教授。
图1. 某一同化时刻的Kalman增益矩阵,同化(a) 单点观测和(b) 空间平均观测的完美模式实验。从左到右列分别是40个集合成员、2000个集合成员、40个集合成员使用GC、LRLF、CLF、ELF和CELF局地化函数。
图2. 连续6天某一时刻第120个观测对应的Kalman增益,同化(a) 单点观测和(b) 空间平均观测的完美模式实验。从上到下分别是40个集合成员、2000个集合成员、40个集合成员使用GC局地化、LRLF、CLF、ELF和CELF。