古吉拉特沿海地区使用线性判别分析和贝叶斯决策准则的AltiKa 40Hz波形分类方法外文翻译资料

 2022-12-26 08:12

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


古吉拉特沿海地区使用线性判别分析和贝叶斯决策准则的AltiKa 40Hz波形分类方法

ADITYA CHAUDHARY, SUJIT BASU, RAJ KUMAR,C. MAHESH, AND RASHMI SHARMA

印度艾哈迈达巴德空间应用中心

摘要:

本文尝试了最近发射的AltiKa卫星获取的40Hz波形分类方法。由于适用于基于布朗模型的高度计回波的重跟踪算法不适用于来自沿海海洋的回波,因此需要针对这种回波设计特定算法。在沿岸海洋中,由于海岸线几何形状和地形的变化,波形显示出各种各样的形状。因此,需要适当的分类方法来将波形分类为各种类别,以便每个类别应用合适的重跟踪算法检索海洋参数。该算法包括三个步骤:特征选择,线性判别分析和贝叶斯分类方法。分类算法已应用于古吉拉特海岸附近的波形。在印度东海岸附近进行了独立验证。两个沿海地区获得的混淆矩阵非常令人满意。为了说明,提供了分类的各个示例。

关键词:波形分类,高度测量,线性判别分析,SARAL/AltiKa,40-Hz波形

引言

在开阔的海洋中,测高回波遵循标准形状,前沿急剧上升,后沿功率逐渐减小。这种标准形状与理论上的布朗模型(Brown 1977)一致,所以可以很容易地建模。即使在开阔的海洋中,波形的形状也因高度计而异。对于印度和法国空间机构之间的协同任务中SARAL卫星携带的AltiKa,后沿功率迅速下降;对于Jason-2,这部分波形的功率会缓慢下降。但无论如何,能够从使用最大似然原理(Rodriguez 1988),最小二乘法(Maus等人1988; Sandwell和Smith 2005),或贝叶斯推理(Severini等人,2008年)建模的波形中有效地估计如海面高度和有效波高的地球物理参数。然而,在沿海地区,由于高度计足迹中陆地的存在造成的影响,高度波形被破坏。高度计足迹是在单个脉冲中在一定数量的门上累积的反射功率表面的面积AltiKa有128个门。在回波波形中可以清晰看到陆地影响。因此,沿海地区测量的波形不符合理论布朗模型,沿海波形产品需要特殊的数据处理工作。事实上,有些项目专门用于分析沿海波形,即PISTACH(Mercier等人,1998年)和COASTALT(Gommenginger等人,2011年)。

地球物理参数可以使用重跟踪算法从高度计数据获得。在开阔的海洋中,波形是布朗型,对于它们存在合适的算法(Amarouche等人,2004)。适用于基于布朗模型的高度计回波的重跟踪算法不适用于近海,因此需要针对这种回波设计特定算法。多年来,针对特定表面已经开发了几种重跟踪算法,例如,Beta 5/9算法(Martin等人,1983),OCOG(offset center of gravit)技术(Wingham等人,1986)和用于大陆冰盖的ICE-2算法(Legresy和Remy 1997)。这些也适用于沿海波形的重跟踪。Guo等人(2006)提出了一种基于前沿检测和子波形提取的改进的阈值重跟踪算法。

在近海中,波形显示各种各样的形状,需要适当的分类方法来将波形分类为各种类别。之后,可以应用合适的重跟踪方法来检索海洋参数。Freeman和Berry(2006)开发了一个专家系统,将沿海的波形分类为各种类别,然后对它们采用不同的重构方法。缺点是在这种类型的分类中需要先验知识。Deng和Featherstone(2006)基于对澳大利亚周围波形的系统分析,开发了一种重跟踪系统。Yang等人(2012)基于波形分类和子波形提取开发了一种重跟踪方法。1类是类似海洋的波形,容易使用标准海洋重跟踪方法地进行重跟踪。属于2类的波形也可以重跟踪。对于属于2类的波形,提取包含前沿的子波形,然后将海洋重跟踪法应用于提取的子波形。属于3类的波形没有前沿,无法重跟踪。其他人还尝试了在重跟踪之前同时处理多个波形以检测明亮目标(Gomez-Enri等人2010; Quartly 2010)。Passaro等人(2014)提出了自适应前沿子波形(ALES)重跟踪法,可以应用在开阔海洋和近海而不会出现间断。

更复杂的分类方法也被开发出来。Tourneret等(2008)和后来的Tourneret等人(2010)使用线性判别分析(LDA)和异常检测,然后使用贝叶斯决策规则对高度计回波进行分类。实际上,在后一篇论文中,他们提供了要分类的信号的形状原型。从Halimi等人(2013)的研究中可以清楚地看出这种分类的可用性,他们展示了如何使用不同的重跟踪算法轻松地重跟踪7类和13类(具有非对称高斯峰的布朗模型)的波形。除了能够将合适的重跟踪算法应用于属于特定类别的波形之外,波形分类还有另一个目的,即为用户提供有关信号形状的信息,这使他/她对分析各种重跟踪算法输出具有一定的置信度。和Tourneret等人一样(2008,2010),我们使用LDA对SARAL卫星上的AltiKa高度计测量的波形进行分类

图 1 研究中使用的古吉拉特海岸附近SARAL AltiKa的不同轨迹

图 2 用于分类的不同类别的波形(在Tourneret等人2010之后)

数据和分类方法

我们选择了印度古吉拉特的沿海地区。我们使用在2013年3月17日至2013年12月22日期间9个周期数据11个轨道的SARAL S-IGDR数据构建算法。选定的轨道如图1所示。我们还选择了孟加拉湾的另一个沿海地区,对我们的分类算法进行了独立验证。我们为此验证选择了一个特定的AltiKa轨道,其中包含九个周期的数据。我们的分类方法包括以下三个步骤:(i)特征选择,(ii)使用LDA降低维数,以及(iii)类别分配。下面我们描述每个步骤。

特征选择

选择分类特征是波形分类的重要步骤。应使用足够数量的特征进行分类以使其有效,对于K类,特征空间中应至少存在K-1特征。我们使用了图2中所示的八个预定义类,所选特征的数量为12.根据Fisher标准量化的相对重要性选择特征(图3)。 图3显示了与高度回波直接相关的参数,如偏斜,峰度,重心以及宽度,它们的形状对高度信号分类是非常重要的。继Tourneret等人之后(2008),我们使用LDA从这些特征中提取相关信息。

使用LDA降低维数

LDA包括将数据矢量theta;(由所选特征组成)投影到通过求解以下面方式获得的广义特征值问题而获得的判别轴上。对于类,hellip;,的c类问题,Fisher准则定义为

(1)

其中SB和SW是的类间和类内散布矩阵,定义为

(2a)

(2b)

其中:第i类训练集中的元素个数;:类中参数的平均值;:总平均矢量,定义为,其中;:包含与类相关的参数向量的训练集的子集。Fisher准则的最大化导致以下广义特征值问题

(3)

图 3 所考虑参数的Fisher准则。LEP,宽度,COG是从OCOG算法直接计算的参数;W_t是OCOG 算法针对前40个门计算的宽度:并且P_t是后沿的峰值

图 4 非归一化的(a)和归一化的(b)的实验数据集的主成分

其中lambda;是特征值,omega;是相应的特征向量。通常有c-1个特征向量与非零特征值相关联。在应用适当的分类规则之前,最终将特征向量投影到c-1判别轴上。投影矢量比原始特征矢量更适合于分类目的。此外,在本研究过程中发现,归一化(通过将相应列向量的每个元素除以其标准偏差)得到比直接使用原始有更好的分类结果。这在图4中使用归一化和非归一化的前两个分量(表示为两个主要主成分)示出。该图显示了实验数据集(代表不同类别的不同颜色)。

人们经常会问的一个问题是:使用LDA的额外好处是什么?换句话说,如我们在整个波形上执行主成分分析(PCA)会发生什么?分类会以某种方式受到影响吗?为了回答这个问题,我们在整个波形上进行了PCA,结果显示在图5中。从图中可以清楚地看出,类没有明显分离,并且存在明显的重叠。因此,这对我们所做的特定特征向量进行LDA是非常有益的。

图 5 完整波形上PCA分析的实验数据集的主要分量

类别分配

这是贝叶斯分类方法(BC)应用的最后也是最重要的一步(Tourneret等人,2010)。在某种意义上它是最优的,它最小化了分类错误的概率。在这种方法中,必须定义一个损失函数,它是不同分类方法错误造成的损失的简单概括。在当前情况下(零损失功能情况),BC将后验规则减少到最大值。此规则可以定义如下:

波形被分配给类

所有的 (4)

其中是以类为条件的的概率密度函数(pdf),而是类的先验概率。虽然我们在海岸附近工作,但属于类似海洋的波形的波形数量仍然很大,大约为70%。作为一个工作假设,我们已经将0.5的先验概率分配给第1类。其余的类被赋予相等的概率,使得所有概率的总和为1。我们进一步假设条件pdf是Gaussian,再次跟随Tourneret等人。(2010年)。

结果和讨论

我们使用了由1000个40-Hz波形组成的实验数据集。这些波形是随机选取于80,000个波形。使用上述步骤,通过使用留一法的方法为实验数据集构建混淆矩阵,如表1所示。在该方法中,我们通过实验分类方法N个单独的时间来估计给定算法的准确性(N在我们的情况下为1000),每次使用训练集,从中删除了不同的单个实验点。在单个删除点和分类方法的准确度估计上测试每个得到的分类方法。该表证明了分类方法的强大功能。理想情况下,这种混淆矩阵应该只有对角元素。理想情况下,非对角线值应为零。然而,没有分类方法可以是完美的,因此在类之间存在一些混合。第6类适用于属于后沿增加Brown类的波形(图2),相关波形的分类具有完美的精度。本方法的最差性能是针对3级(非常嘈杂的回声)。这一类的一些原始波形被分配到6类和8类。

表格 1

训练数据集的混淆矩阵。 N是波形个数

<td

剩余内容已隐藏,支付完成后下载完整资料</td


资料编号:[17517],资料为PDF文档或Word文档,PDF文档可免费转换为Word

1

2

3

4

5

6

7

8

N

原始的类

1

91.3

0

0

0

3.8

0

4.9

0

650

2

0

92.0

0

0

0

0

0

8.0

50

3

0

0

76.0

12.0

0

0

0

12.0

50

4

0

0

0

88.0

0

0

0

12.0

50

5

0

0

0

0

86.0

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。