SeaWinds残差特征分析和质量控制外文翻译资料

 2022-12-26 08:12

英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料


SeaWinds残差特征分析和质量控制

摘要:最近的一些研究表明风场反演残差或最大似然估计值(MLE)对于QuikSCAT HDF数据的风场质量控制有很重要的影响。自2000年3月起,QuikSCAT的近实时(NRT)产品开始使用二进制通用格式(BUFR)。 由于该产品用于数值天气预报(NWP)数据同化,必须包含质量控制程序。我们通过研究MLE值的特性来确定HDF的质量控制 (QC)流程是否适合于BUFR数据。对比真实的HDF数据和BUFR数据,我们发现二者的MLE值分布大不相同并且相关性很低。其中,很重要的一个不同点就是风场反演之前的信号平均方法。与HDF数据相比,信号平均减小了用于反演BURF风场产品的观测次数。我们用一个简单的例子表明,这种信号平均确实是产生不同MLE值的原因。 此外,我们还通过仿真将理论与实际联系起来,以便更好地球物理解MLE值。尽管BUFR和HDF产品的MLE不同,但是它们的风场质量(与欧洲中期天气预报中心(ECMWF)预测的风场相比)非常接近。与HDF的质量控制(Q)类似,我们为BUFR数据开发了基于MLE值的质量控制流程,并进行比较。结果显示,BUFR的QC效果与HDF的非常接近,这说明尽管两种格式的数据具有不同的MLE值,但MLE作为QC敏感因子的特性是一致的。

索引项:最大似然估计;质量控制;降雨;海风,散射计

Ⅰ.介绍

极端天气对人类生活和社会经济都可能产生巨大影响,但一直以来我们对这种天气的预测总是不尽人意。数值天气预报预测极端天气的强度和位置所面临的主要问题之一就是缺少对很多天气扰动的发生地——海洋的观测。星载散射计具有较大的覆盖范围,能够提供准确的海面风场数据,有助于改善热带和温带气旋的预报情况。

观测对天气预报的影响通常取决于所应用的质量控制(QC)。 例如,Rohn和Kelly [4]显示了在进行QC之后云导风对欧洲中期天气预报中心(ECMWF)模型的影响是正向的,而没有进行QC时影响是负向的。 这也适用于散射计数据。 除了对NWP的重要性,在临近预报和短时预报等应用中,更好的质量控制也有助于提升气象学家对散射计数据的信心。 因此,为了在上述应用中成功使用散射计数据,首先需要进行全面的质量控制。

近期和过去对散射计QC进行的相关工作均指出风场反演的残差是一个很好的QC敏感因子。 Stoffelen和Anderson [5],Figa和Stoffelen [6]以及Portabella和Stoffelen [7]使用一种基于残差的方法分别为ERS、NSCAT和SeaWinds散射计检测和剔除质量差的风矢量单元(WVC)。此外,文献[8]也说明了风场反演残差在QC中的重要性。

因此,残差的分布对QC很重要。风场反演的残差(或最大似然估计(MLE)值)表示在特定风矢量的反演中使用的后向散射测量值与地球物理模型函数(GMF)的匹配程度,后者是在良好天气的风条件导出的。后向散射测量与GMF的非一致性越强,则MLE值越大,表明测量受GMF模型之外的地球物理参数(例如,诸如降雨,复杂的海况或海冰)的影响越大,因此MLE值是反演风质量的指示。

SeaWinds数据首先由喷气推进实验室(JPL)处理,然后以两种不同的格式发行。 QuikSCAT分层数据格式(HDF)产品由JPL直接分发,近实时二进制通用格式(BUFR)产品由国家海洋和大气管理局(NOAA)分发。 由于最初的数据仅以HDF格式分发,Portabella和Stoffelen [7]对QuikSCAT的该种数据进行了质量控制处理。从2000年3月起,QuikSCAT近实时BUFR产品开始发布。 该产品是用于同化的产品,因此需要为它开发QC处理流程。

图1显示了BUFR MLE与HDF MLE的二维(2-D)直方图的等高线图。 正如预期的那样,该图表明两种MLE分布的相关性较小(约0.5)。 此外,BUFR的平均 MLE值(0.28)明显小于HDF的平均值(0.57)。 从这些结果可以清楚地看出,为了确定是否对BUFR使用与HDF类似的QC流程,需要对MLE进行全面的分析。

第二节介绍SeaWinds仪器和数据。 在第三节中,我们通过提供理论实例,仿真研究和实际数据的详细分析,阐明观测到的MLE值差异。 然后,在第四节中测试了MLE差异对反演风场和QC的影响。 最后,第五节介绍结论和建议。

Ⅱ.仪器和数据

QuikSCAT卫星(1999年6月19日发射)上SeaWinds仪器是一个锥形扫描笔形波束散射计。 它采用尺寸为1m的旋转抛物面天线,具有两个点波束,即一个H极化和一个V极化波束,分别以46和54的入射角进行圆形扫描。 天线发射微波脉冲的频率是13.4 GHz(Ku波段),扫描幅宽1800公里(以星下点轨迹为中心)。仪器每天约测量110万个25-km风单元的数据,覆盖90%的地球表面。

沿着交轨(垂直于星下点轨迹)方向,SeaWinds的刈幅被划分成等间隔的风单元(WVC)。沿卫星运动方向观察时,风单元的序号从左到右递增。WVC的标称尺寸是25 km times;25 km,所有以WVC为中心的后向散射测量都用于反演WVC风场。 由于锥形扫描,每个WVC通常在波束向前看(前)时被观测一次,在向后看时被第二次观测。 因此,每个WVC有多达四个测量类别(这里称为“波束”):H极化前视,H极化后视,V极化前视和V后视。 由于H极化波束的入射角是46°,观察的刈幅较小(1400 km),外部区域的WVC仅具有V极化前后视的后向散射测量。 有关QuikSCAT仪器和数据的更多详细信息,请参考[9] - [11]。

如第一节所述,QuikSCAT数据以两种不同的格式发行:HDF和BUFR。这里使用两种格式三天的QuikSCAT数据(WVC编号9-28和49-68)来说明用于QC的MLE特征。

HDF和BUFR产品之间的主要区别与0的空间分辨率有关。 在BUFR产品中,特定的波束(前 - 内,前 - 外,后 - 内,后 - 外)由属于同一WVC的该波束的所有后向散射测量平均得到。 在HDF产品中,所有的后向散射测量都是单独呈现的。

SeaWinds的0的足迹可以是“蛋形”或切片。 在特定的WVC中,“蛋形”0是来自整个脉冲足迹的雷达反向散射系数,其中心落在WVC中。 “蛋形”可以细分为单独的距离采样或切片; 将中心落在相同WVC中的特定“蛋形”的切片进行加权平均(加权因子直接取决于每个切片“测量”的噪声)得到组合之后的0。 天线足迹或“蛋形”是方位分辨率约为25 km、距离分辨率约为37 km的椭圆。通过距离分辨率,切片的方位方位分辨率约为25 km、距离分辨率为2-10km(标称尺寸为6km)。

HDF真实数据是在“蛋形”分辨率的基础上得到的(截至目前)。 因此,尽管WVC的尺寸是25km,但是从WVC中的所有“蛋形”0获取的风场的实际分辨率大约是40km。 组合平均主要的主要影响在距离向将风场分辨率提高至25 km,对方位分辨率几乎没有影响。

为了表征和验证BUFR数据的质量控制流程,我们将QuikSCAT数据与ECMWF风场和特殊传感器微波成像仪(SSM / I)降雨数据进行配对分析。 QuikSCAT数据是JPL使用NSCAT-2 GMF生成的初步科学数据产品。 (请注意,最新版本的QuikSCAT处理使用QSCAT-1 GMF. Portabella和Stoffelen [12]表明NSCAT-2比QSCAT-1更适合反演,即NSCAT-2的平均MLE低于QSCAT-1对应的结果)

我们使用ECMWF62.5公里网格的分析场和3小时,6小时和9小时预报风场,在空间和时间上插值到QuikSCAT数据观测的位置和时间。

SSM / I降雨数据的配对规则是时间上小于30分钟和距离上与QuikSCAT的观测位置小于0.25。 SSM / I仪器是国防气象卫星计划(DMSP)卫星。 我们使用的是DMSP F-13和F-14卫星(最近的卫星)。 大多数与F-13的配对数据都是在低纬度地区(热带地区),而与F-14的配对数据则在中高纬度地区。

III.MLE特性分析:0平均对其分布的影响

SeaWinds风场反演就是要使下面最大似然估计的代价函数最小化

其中N表示观测次数; 是测量的后向散射系数; 是通过GMF仿真的不同风速和风向对应的后向散射系数, kp()是测量误差的方差。

Stoffelen和Anderson [5]将MLE解释为在变换的测量空间中(每个轴通过kp规格化)一组测量后向散射系与GMF表面上的解集之间的(平方)距离的度量。

如第一部分所述,MLE是散射计中的一个很好的QC敏感因子。 QuikSCAT基于MLE的方法成功地对HDF数据进行了质量控制[7]。 因此,如果需要为BUFR数据开发QC流程,须仔细研究MLE的分布。

如第二节所述,BUFR的每个0是WVC中每个波束所有HDF测量值的平均值。 从理论的观点来看,HDF和BUFR不同的MLE分布可能仅仅是计算中使用不同数量0引起的。 本节我们用一个简单的例子来说明这一点。 为了验证理论结果,我们通过仿真将理论与实际联系起来。

A. 理论实例

这种情况对应于一种简化版本的MLE,使用了以下假设:

(1)对于SeaWinds,HDF每个WVC的观测次数(N)通常大于40,而BUFR刈幅内部区域每个WVC的观测次数(M)等于40。 因此,相对于BUFR的MLE,HDF的MLE是在更高维度测量空间中计算的。 在这个例子中,我们假设N = 2且M = 1来简化问题。

(2)为了简化问题,算法和流程都是基于我们设定的测量空间。

(3)由于散射计中的误差被当做高斯误差,我们在N(=2)维空间里设定了一组测量变量(x,y)用来作为原点解周围的高斯分布点。 因此,我们使用以下2-D高斯概率密度函数(pdf):

在两个轴上数据的标准差被认为是完全一样的,即i.e.,=x=y。

(4)为了简化问题,我们还假设HDF和BUFR数据的归一化噪声值都是恒定的。 因此,MLE值等于距原点距离的平方与一个常数的乘积。 这个假设十分重要,它可以让我们通过设置Ngt; M来表现出MLE分布的重要变化。

  1. 数学演示:为了显示两种分布的不同,我们使用以下数学定义。
  • 函数f(x,y)的平均值或期望值由高斯概率密度函数p(x,y) 定义:

  • 函数f(x,y)的标准差是由上述基于高斯概率密度函数定义的函数来表示的:

  • 最后,函数f(x,y)与g(x,y)之间的相关系数定义如下:

基于以上假设,我们可以针对HDF和BUFR数据将(1)式重写:

  • HDF数据(N=2):基于上述假设中的恒定噪声值、i.e.、(见假设4),在二维情况下MLE值为:

  • BUFR(M=1):此时测量值z是两种测量值x,y的平均,即z=(x y/2),z=0为原点(解)。测量噪声值可根据式(2)-(4)简单地算出,即如下表达:Kpz=(SD(z))sup2;=sup2;/2。所以一维情况下MLE值为:

为了体现出在一维和二维情况下MLE分布的不同(分别于BUFR和HDF数据的MLE值相似),我们使用如上数学定义(式3-5)计算了他们的平均值、标准差以及相关系数。

结果表明,在观测空间中通过平均将观测维数从二维降到一维并没有影响平均MLE值(E(MLE1-D)=E(MLE2-D)),但是MLE分布的标准差却变大了(SD(MLE1-D=1)而SD(MLE2-D)=radic;2)。此外,二维和一维分布下的MLE值具有很明显的去相关性(COR(MLE1-D MLE2-D)=0.7)。因此,MLE分布差异是很明显的。

在图1中,我们通过HDF和BUFR两种格式三天的QuikSCAT数据直接比较其MLE分布的不同。像前文介绍中所说的那样,BUFR MLE值的二维直方图与HDF MLE值的等高线图表示出两种数据的MLE分布之间确实存在很小的相关性。然而,理论结果与实际略有不同。相关值在实际中要更小一些,且HDF数据和BUFR数据分布平均值的比值在理论上是1,而在实际中(BUFR的MLE值0.28比HDF的MLE值0.57要小)是2。这是在预料之中的,因为在我们的理论中对问题做了如前文所述的简化。为了了解实际情况中的细节,需要进行更多的仿真。

图2.(a)WVC=12和(b)WVC=55的0数量的归一化直方图图,实线表示内波束(包括前向和后向),虚线表示外向波束。

B、MLE 仿真

在第III-A节的简单示例中,我们表明了HDF和BUFR MLE分布之间的弱相关性是由于对°进行了平均,并且假设HDF格式的测量次数为2,BUFR格式的测量次数为1。 然而在实际情况中,HDF数据包含的测量个数超过四次,BUFR通常具有四次测量,两者虽然很相似,但在理论情况中却存在差异。 在实际中二者的相关值(0.5)要比在我们的理论中得出的相关值(0.7)要小。

在本节中,我们将对HDF和BUFR数据的ML

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[17667],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。