英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料
提高降雨条件下散射计风精度的神经网络技术
Bryan W. Stiles and R. Scott Dunbar
摘要:我们展示了一种提高Ku波段海面风场散射计在降雨条件下的风场精度的技术。该技术是自主的,因为它只使用由散射计所做的测量,没有外部数据集依托(例如,降雨辐射计),不需要执行校正。对每个风矢量单元,该技术的唯一输入是归一化雷达散射截面的测量, 单元的交叉轨道距离作为测量几何结构的代理,在没有降雨校正的情况下名义上反演单元风矢量。这最后的输入是用来避免改变没有被雨污染的风。这项技术已应用于QuikSCAT 2008年1月份的数据,从而显著改善了降雨下的数据。关于数据被确定为受喷气推进实验室降雨标识符污染的雨水,美国国家数据浮标中心25公里的浮标风的均方根速度误差从8.9米/秒提高到3.5米/秒。雨中均方根速度误差亦较欧洲中部中期天气预报由7米/秒提高至3米/秒。未被标记为雨水污染的数据并没有明显的改变,尽管这一技术并没有利用降雨标识符。这项技术能够区分受雨水污染的风单元和无雨的风单元和大幅度提高前者的风速精度,仅使用QuikSCAT数据,而不求助于任何关于降雨程度的外部信息。
第一节 介绍
QuikSCAT上的海风测量仪器自1999年6月19日以来一直在地球轨道上。从那时起,它就定期地将覆盖全球所有海洋的海表面风矢量每隔一两天进行传送(90%的覆盖率在一天内)。这是一套极为丰富的数据集,已用于许多科学和操作目的(例如[1]-[3]、[9]和[10])。数据集的主要缺点是受雨水污染。在QuikSCAT任务期间,多名研究人员共同努力解决这一问题,结果喜忧参半。在[6]中,有一种方法是简单的,仅凭QuikSCAT的数据就可用于估计雨和风。这种方法在小雨到中雨的情况下是有用的,但它的问题是增加了在无雨地区的噪音。对于雨水占优势的区域来说,它也是次优的。为了避免这些问题,Draper和Long使用了三种不同的反演算法:一种只有风的反演方法和一种只有雨的反演方法,另外还有雨和风的反演。确定这三种反演方法中的哪一种本身就是一个重要的问题。其他作者试图利用外部降雨信息(即共定位微波辐射计数据)纠正降雨污染。例如,见[7]和[15]。因为雨的特点往往是小规模和时变的,涉及外部数据源的校正方案要求外部数据与散射计密切同步,并与散射计同步。在实践中,这限制了这类技术的适用性不到QuikSCAT总数据集的40%。与QuikSCAT不同,为期9个月的Midori-II任务中的海风与高频微波扫描辐射计(AMSR)共用一个平台,使共定位的主动/被动数据始终可用。我们的技术利用这个独特的数据集来回归在所有天气条件下雷达后向散射系数(NRCS)与风速之间数学关系的参数模型。然后,利用所发展的模式从QuikSCAT数据中反演风。基于最大似然估计法(MLE)的技术在海风/AMSR数据集中导出它们的风和雨对后向散射影响的参数模型[11]。
所有以前的雨校正技术都依赖于雨对雷达后向散射系数(NRCS)影响的模型,这些模型被一个或两个降雨参数参数化。对于用于使用来微波辐射计的外部数据的技术,这些参数是作为外部数据的函数得到。对于仅使用散射计的方法[6]、[11],参数被添加到用于风反演的MLE的搜索空间中。 由于雨滴粒径分布的变化、局部降水以及降雨三维分布的影响,实际的雨水污染有两个以上的自由度。设计物理模式以准确反映雷达后向散射系数(NRCS)测量结果的降雨污染情况,特别是在中雨至暴雨地区,很难做到这一点。包含足够的参数以剔除雷达后向散射系数(NRCS)中的雨水污染的模型,往往包括无法通过散射计测量或甚至与雨辐射计相结合观察到的参数。本文描述的技术手段是另一种方法。本文所描述的技术是另一种方法。不是显式模拟降雨与雷达后向散射系数(NRCS)之间的关系,我们试图将风的参数模型回归为关于受雨污染的雷达后向散射系数(NRCS)测量结果。
Quikscat散射计测量的是10米处的“等效中性风”,这个量等于海面以上10米处当温度梯度在海气界面为零和海流可以忽略不计时的风速[刘和唐,2006]。本文所描述的技术还测量了10米的等效中性风,因为它是在相同的QuikSCAT上工作的,在无雨条件下,它被校准为对标准的QuikSCat风是无偏的。
每个QuikSCAT风矢量单元都有四种不同“喜好”的雷达后向散射系数(NRCS)测量,包括前后两束。因为QuikSCAT采用了旋转铅直波束天线,所以正面和尾部的精确方位角各不相同,从侧面观察在条带的边缘,到正向和向后看在条带的中间。内光束在46°入射水平极化(HH)。外光束为54°入射垂直极化(VV)。我们训练一个由几个人工神经网络(ANN)组成的结构来估计在四个雷达后向散射系数(NRCS)测量数据和风速、风向之间的映射。在1800公里的QuikSCAT条带的200公里宽的边缘,只获得了两个外波束的外观。为了在这个地区利用我们的技术, 我们将需要训练我们的有较少输入的网络的修改版本。虽然这是很容易做到的,但为了简洁起见,本文忽略了该条带的边。我们也不关心消除歧义。大多数散射计风反演技术(包括标准喷气推进实验室(JPL)方法)估计有四套或更少的风矢量(模糊度解)在散射计测量的海面上每个小区域(例如25公里times;25公里)。解决方案为使用利用空间信息和数值风分析或预报将其缩小为单个风矢量。这里使用的技术估计了局部散射计测量的唯一速度和四个可能的方向,但没有尝试选择在方向之间。我们计划在未来的论文中解决在雨中精确消除歧义所涉及的复杂问题。
我们使用的神经网络是非常简单的结构,称为多层感知奇(MLPs)[12]。它们与生物神经系统并不特别相似。由于历史原因,他们被称为神经网络,而不是更好地反映它们的数学简单性和适用性范围(即N维连续函数逼近器)。有限大小的MLPs在数学上已被证明足以将输出有界的连续函数逼近到任意精度[5]。MLP是通过使用一组输入/输出示例反复回归其参数来“训练”的,然后使用一组不同的示例进行“测试”,以查看它是否能够很好地逼近所需的映射。出于我们的目的,这种网络的效用是,给定一些地面真实信息,我们可以将期望的质量(例如风速)作为观测到的雷达后向散射系数(NRCS)值的函数来回归。我们可以在不明确地建模雨和风对后向散射的所有影响的情况下执行此操作,而且不需要找到有效且准确地反转该模型的方法。若要使此操作有效,则不需要在四种不同的NCRS测量来确定一个独特的降雨模式。只要有足够的信息就能确定风向。神经网络技术的强大之处在于它可以在不清楚雨滴、海面和传输之间复杂的相互作用情况下利用四种雷达后向散射系数(NRCS)测量的雨污染误差之间的关系,以估计风。如果雷达后向散射系数(NRCS)测量中的每个“喜好”误差互不相关,那么神经网络就不会有足够的信息来反演风,因为它输入空间缺乏自由度。第二节描述了网络结构的细节,并描述了确定其参数的训练方法。在第三节中,我们证明了神经网络能够准确地估计多雨条件下的风。在第四节中,我们提出了研究的结论。
第二节 方法
在本节中,我们描述了我们用于从雷达后向散射系数(NRCS)测量中反演风的神经网络技术。在我们描述神经网络架构本身之前,我们先简要介绍一下MLE是通常用于从散射计数据中反演海表风的技术。MLE技术用于产生美国航天局(NASA)和国家海洋和大气管理局(NOAA)QuikSCAT数据产品的风场。NASA JPL 25公里风数据产品的输出风矢量被用作这里描述的技术的输入。
MLE技术利用雷达后向散射系数(NRCS)的正演模型(地球物理模型函数)作为风速、入射角、极化和相对方位角的函数。相对方位是风向与仪器观测方向投影之间的角度(天线方位角矢量)。MLE算法进行搜索,为观测到的雷达后向散射系数(NRCS)测量找到最有可能的风速和方向。最大似然函数由以下公式给出
这里,g是地球物理模型函数(GMF),u是风速,phi;是风向, chi;是相对方位,入射角为theta;,p为极化。第一次观测到的雷达后向散射系数(NRCS)测量由sigma;0i和预期的变量表示。在地面固定分辨率单元内对所有雷达后向散射系数(NRCS)测量进行求和。相对方位角相对方位chi;是phi;与天线方位alpha;I的差。为QuikSCAT和大多数其他散射计,f有几个局部最大值(通常是两个到四个)。找出这些极大值,候选风矢量(u,phi;),并计算了它们的似然值f(u,phi;)。通常情况下,在所有速度和方向上以蛮力的方式计算f的计算成本太高,因此采用了寻找峰值的搜索启发式方法。例如,标准JPL QuikSCat风反演算法首先找到了使用粗搜索的每个方向的可能速度。适当地引用了速度和方向上的合成曲线作为“最佳速度山脊”。在最佳速度脊上的似然峰周围执行第二次更精细的分辨率搜索。此搜索结果假定包括 这里是似然函数中的最大值。在找到局部极大值后,不能简单地选择最有可能的(最大的f)作为反演到的风矢量,因为这样的 选择常常导致较大的方向错误。相反,采用模糊度解去除算法来选择“最佳”最大值。选择采用多种因素相结合的方法,包括它自身的可能性和与邻近风矢量的一致性。关于NASA和NOAA目前使用的MLE算法的更多细节见[13]。一种基于耶氏估计理论的类似技术被 Koninklijk Nederland气象学研究所使用并为欧洲航天局的ASCAT C波段波段散射计反演风[16]-[18]。
在降雨的情景中,雷达后向散射系数(NRCS)与风的关系是复杂的。每一次雷达后向散射系数(NRCS)测量都是风速、风向、观测几何学和若干个非线性函数以及降雨相关参数且包括但不限于降雨速率。特别是雨柱高度和雨滴大小分布是非常重要的。雨滴大小分布本身不止一个自由度。此外,对于大多数散射计来说,降雨单元通常小于雷达后向散射系数(NRCS)测量的本征分辨率,因此部分填充效应也应考虑到[21]。如果我们必须包含所有这些参数,那么MLE方法是很难实现的,特别是因为真正的物理关系是很难理解的。没有雷达后向散射系数(NRCS)测量本身中的足够信息可以唯一地确定所有参数[20]。大量的参数也增加了似然极大值的计算复杂度。搜索算法,增加了找不到局部极大值的机会。为了避免这些问题,MLE方法必须采用简化的GMF来处理雨中风的反演问题[6],[11],这是雨、风和雷达后向散射系数(NRCS)之间的关系。神经网络方法与MLE方法没有相同的局限性。给定风的地面真实数据来源,神经网络可以确定从四个不同的雷达后向散射系数(NRCS)测量值到风的精确映射的可能性,而不需要了解GMF或试图显式估计所有相关的参数。地面真实风也是MLE技术所必需的。浮标或浮标形式的地面真相由数值预报或分析而来的风是用来建立MLE技术所需的GMF[11]。对于MLE和神经网络技术,只需从一个有代表性的样本中获取一次地面真实数据,就可以建立GMF或训练神经网络。经过训练,在不直接使用地面真实信息的情况下,风速反演和估计可能的风向(模糊性)可以进行。标准散射计JPL风反演确实使我们的数值风场(NWP),以帮助选择歧义方向[13]。
图 1神经网络风场反演方法框图。输入对速度和液体的回收是背向散射的手段和变化。在每个25公里的单元中,从四个方向中的每一个测量,从官方产品中反演该单元格的速度,并以CTD作为对可观几何的代理。
因为,标准风反演的输出被用作神经网络技术的输入,存在着对数值预报场的间接依赖。这里描述的神经网络技术只反演风速和一组可能的四个方向(模糊)。模糊度解去除已得到实现。
神经网络以前曾用于在无雨情况下反演散射计风速[4]和进行风向去混叠[19]。在无雨的条件下风和雷达后向散射系数(NRCS)之间的关系可以很好理解,MLE方法的性能至少与神经网络技术一样。由于GMF用来模拟风和雷达后向散射系数(NRCS)之间的关系的相对简单性,它更容易使用,更有可能是“真实”的模型,而不是体现在一个神经网络近似更复杂的关系。然而,在多雨的情况下,复杂性的增加以及对风与雨之间关系的认识不足使神经网络方法更有吸引力。利用MLE反演的风作为神经网络反演的输入, 我们优化了我们技术的性能,以适应雨天和无雨的条件。网络利用这个额外的输入来模拟MLE算法在无雨条件下的性能, 同时在雨中进行更精确的风反演。
图1展示了神经网络风场反演方法框图。在图中,四个ANNS用蓝灰色表示。风反演在每25公里的风单元是逐小区进行的
利用三种神经网络实现了雷达后向散射系数(NRCS)到风速的映射。这些网络使用欧洲中心中程天气预报(ECMWF)风、Midori-Ⅱ后向散射测量的海风和Midori-Ⅱ总液体值的AMSR对这些网络进行了训练。流体网1被训练成将海风雷达后向散射系数(NRCS)测量值和在SWATH中的位置映射到AMSR流体值。速度网1被训练成将海风雷达后向散射系数(NRCS)测量值和位置映射到ECMWF风速。训练速度网2将交叉跟踪距离(CTD)和前两个网络的输出映射为ECMWF速度。以这种方式分解速度反演问题简化了每个网络需要匹配的映射,从而提高了它们的准确性。理论上,一个单一的神经网络可以直接将NRC值映射到风速,而不需要估计液态水。然而,我们发现,通过这样解决这个问题,我们可以获得更好的风反演精度。该技术成功的另一个关键是训练集的设计。为了优化网络,使其在雨天等罕见情况下表现良好,有必要在训练数据中过多地表示这些情况。因为只有雨水污染发生在sim;2%的情况下,我们不能使用降雨事件的自然频率。训练集中如此小的一部分相关的误差对神经网络参数的优化影响很小。为了避免这个问题,我们在速度网1的训练中包括了25倍的自然降雨百分比。然后,我们使用一个自然分布的训练集来训练速度网络2,以防止网络高估降雨效应的重要性。每个网络的结构和训练方法与文[14]中描述的飓风风速恢复神经网络的结构和训练方法相同。
JPL QuikSCAT原本对ECMWF的风速在风速依赖方式有偏见。偏倚的选择是基于NOAA和NASA科学家的经验,这表明ECMWF倾向于低估强风事件(例如,[2])。对于这里开发的技术,我们选择在明确的条件下保持与ECMWF有关的名义Quik
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[17570],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。