英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料
基于主成分和多元回归分析研究地面臭氧模型以及影响其浓度的因素
Sabah A. Abdul-Wahaba, Charles S. Bakheitb, Saleh M. Al-Alawia
aSultan Qaboos University, College of Engineering, Mechanical and Industrial Engineering Department,P.O. Box 33, Al Khod, Postal code 123, Muscat, Oman
bSultan Qaboos University, Department of Mathematics and Statistics, College of Science, Al Khod, Postal code 123, Muscat, Oman
Received 5 June 2003; received in revised form 16 June 2004; accepted 1 September 2004
摘要 采取七种环境污染物(,,,,,和)的浓度和气象变量(风速和风向,空气温度,相对湿度和太阳辐射)的数据,通过使用多元线性和主成分回归的方法对大气中的臭氧浓度进行预测。对于白天和夜晚时段进行了单独分析。在这两个时段,污染物与臭氧高度相关,但都呈负相关。使用多元回归分析的方法将预测因子污染物和气象变量,对臭氧数据进行拟合。使用一种基于高负荷的方差最大旋转的主成分分析的变量选择方法,以获得包含在臭氧数据对数的回归模型中的预测变量的子集。结果发现,虽然高温和高太阳能导致增加日间的臭氧浓度,但是排放到大气中的污染物和正在耗尽。夜间的臭氧浓度主要受氮氧化物( )的影响,而气象变量对此没有显著影响。然而,该模型预测夜间臭氧浓度没有预测日间那样准确。这可能是由于本研究未明确考虑的其它因素。 关键词:统计分析;主成分分析;回归分析;变量选择方法 |
- 介绍
据报道,对流层臭氧()是光化学烟雾的主要指标物质。它被公认为降低空气质量的主要污染物之一(Van Eijkeren et al.,2002;Xu and Zhu, 1994)。它是羟基()的关键前体,它控制着大气的氧化能力(Logan 等,1981;Thompson,1992)。的浓度反过来影响许多剩余物质如,和的浓度(Poulida et al.,1991)。此外,高臭氧浓度水平不仅在植物物种、各种天然材料和制成品中起破坏作用,还导致损害人体肺组织(Wang and Georgopoulos,2001)。臭氧没有显著的主要排放到大气中,所有发现的臭氧都是由空气中发生的化学反应形成的(,1976)。因此,臭氧是一种次生的光化学污染物,它本身并不会污染。它产生于人为前体,包括排放挥发性有机化合物()和氮氧化物()的工业和车辆。这是臭氧是一个难以控制和预测的严重环境问题的主要原因。
臭氧产生于主要污染物和(通常称为非甲烷烃,)在阳光作用下的相互作用。总的来说,和被称为臭氧前体。形成对流层臭氧的其他机制包括平流层注入和影响富足的过程。最终结果是的产生受限于,,,过氧自由基和其他烃的供应(Blankinship,1996)。
臭氧的破坏通过许多途径发生,其中最重要的是表面沉积。通过在液相反应中可获得臭氧消耗的其它途径。除了竞争性运输和清除过程的速率之外,这些反应的速率根据气象和光解条件而变化很大。清除过程主导着和奇数氮物种()的去除,使得它们在大陆或海洋边界层的寿命比在对流层上层低得多(Blankinship,1996)。
除了受到光化学的非线性特性的影响之外,臭氧与其前体之间的关系因为气象和化学过程可以在很宽的时间和空间范围内相互作用而变得复杂。例如,化学反应速率范围从非常快到非常慢。快速反应对排放局部有直接影响,并且可能受到大气混合物的强烈影响。另一方面,慢速反应对局部混合相对不敏感,并影响更广泛、区域性或是全球空间地区(Georgopoulos,1995;Wang and Georgopoulos,2001)。
一些研究结合了统计回归,图形分析,模糊逻辑的方法和聚类分析,研究了气象条件和臭氧浓度之间的这种关系(Abdul-Wahab et al.,1996,2000;Abdul-Wahab,2001;Abdul-Wahab和Al-Alawi,2002;Blankinship,1996;Buhr et al.,1995;Clark和Karl,1982;Cox和Chu,1991;Lavecchia et al.,1996;Peton et al.,2000)。
多元回归分析是表达响应变量对几个自变量(预测)的依赖性的最广泛使用的方法之一。然而,尽管在许多应用中它明显成功,但当自变量彼此相关时,回归方法可能面临严重的困难(McAdams et al.,2000)。
多重共线性或回归方程中自变量之间的高度相关性会使得难以正确判断物理过程中最重要的贡献者。去除这种多重共线性和冗余自变量的一种方法是使用多元数据分析(MDA)技术。MDA已被用于分析大量环境数据(Buhr et al.,1992,1995;Chang et al.,1988; Sanchez et al.,1986;Statheropoulos et al.,1998)。
一种方法是主成分分析(PCA),其已被用于空气质量研究中(Maenhaut et al.,1989;Statheropoulos et al.,1998;Shi and Harrison,1997;Tian et al.,1989;Vaidya et al.,2000)以将相互关系分离成统计上独立的基本成分。它们用于减轻多重共线性问题和探索自变量之间的关系,在回归分析中同样有用,特别是如果不显著的哪一个变量是预测变量。PCA中的新变量作为预测变量,在回归方程中使用变得理想,因为它们优化了空间模式并消除了由多重共线性引起的可能的并发问题。
- 主成分分析
本质上,PCA最大化原始变量之间的相关性,以形成相互正交或不相关的新变量(Tsunami,1999)。它是因子分析的一个特例,它将原始的一组相关变量转换为一组新的相同数量的独立不相关变量或主成分(PC),它们是原始变量的线性组合。主成分的排序方法是,第一个主成分(PC)解释了数据中的大部分差异,后续的每一个都占有其前一个未考虑的最大变异比例。尽管主成分(PC)的数量等于独立原始变量的数量,但通常来说,数据集中的大部分变异可以被用于代表原始观察的前几个主成分来解释。
主成分方法也用于选择回归方程的变量子集。一种应用是获得主成分的方差最大旋转,并保留与前几个成分中的每一个相关联的原始变量的子集,然后将其用作回归中的预测变量。方差最大旋转确保每个变量只与一个主成分最大相关,与其他成分几乎无关。关于这些和其他方法的更多细节可以在别处找到(Jolliffe,1986;Malinowski,1991;Statheropoulos et al.,1998)。
在研究中,我们结合多元回归方法和主成分分析(PCA),获得对流层臭氧的预测模型与其他测量的环境空气浓度数据和气象参数作为预测变量。该研究专注于鉴定在白天和夜间调节臭氧水平的因素。主成分分析用于过滤数据,使得只有观察到的对臭氧水平负责的显著独立变量会被确定。臭氧与其他测量参数之间的关系采取三种建模方法:逐步多元回归,主成分回归和选取在旋转主成分上具有高负荷的变量,然后在多元回归分析中使用。
-
材料和方法
- 调查区域和数据收集
位于科威特大学卡迪亚住宅区的科威特大学移动实验室根据该地区的电力,安全和地形的可用性被选为抽样地点。我们注意到,在距此地各个方向500米范围内都没有高楼或树木。图1显示了科威特地图和卡迪亚住宅区相对于科威特市的位置。由于该区域靠近交通量大的主要高速公路,预计该区域将受到交通负荷中不断排放的污染物的影响。全年(1997年)的风向图放在图1上。风向图表明,大部分盛行风来自西部,第二盛行风向西北。 因此,监测点位于舒韦赫工业区和舒韦赫电厂的下风。 这表明舒韦赫工业区和舒韦赫电厂也将影响监测点。
移动实验室配有化学监测器和气象传感器。所有安装在实验室内的装置都是自动操作的。每5分钟连续记录瞬时测量值。测量的污染物包括
图1 卡迪亚住宅区与科威特市和科威特其他地区的关系。风向图也叠加在图上。
甲烷(),非甲烷烃(),一氧化碳(),二氧化碳(),氮氧化物(),二氧化氮(),二氧化硫()和臭氧()。同时监测的气象参数包括风速和风向,气温,相对湿度和太阳辐射。有关移动实验室仪器的更多细节可以在其他地方找到(Abdul-Wahab et al.,1996; Abdul-Wahab and Al-Alawi,2002;Elkamel et al., 2001)。根据Abdul-Wahab和Al-Alawi(2002年),卡迪亚住宅区偶尔会受到超过国家环境空气质量标准(NAAQS)80 ppb的环境臭氧浓度的影响,结果证实,高臭氧事件主要发生在夏季。根据这些发现,我们仅选择了6月1日至30日夏季收集的空气质量数据。
-
- 分析方法
研究发现白天臭氧的测量值与夜间的臭氧测量值显著不同(Abdul-Wahab and Al-Alawi, 2002)。在白天,记录的臭氧浓度高于夜间。浓度会从一天的早些时候迅速增加,在中午达到高峰,然后在晚上稳定地下降到低点。这对于像臭氧这样的光化学产生物是同预期的。因此,白天数据集包括了影响臭氧和臭氧前体之间关系的当天的光化学活性期。于是,收集的数据在这两个时期分别处理。日间数据集包括在白天(06:00-17:00时)记录的所有观察结果,而夜间数据集包括在夜晚时间(18:00-05:00时)记录的所有观察结果。
通过获得每个数据集的相关矩阵以评估各种变量之间成对关联的度量。然后进行逐步多元回归,首先选择臭氧,然后用它的自然对数变换值作为因变量,并通过预测变量的方差膨胀因子(VIF)检查结果的多重共线性。
使用变量的相关系数获得预测变量的主成分。得到主成分分析的结果有两个目的。首先,它们被用于主成分回归分析(PCR),在加入回归方程选择主成分时采取逐步回归的选项,臭氧作为因变量。臭氧数据在使用前首先标准化。接着,使用主成分的方差最大旋转,作为变量选择技术来选择包含在最终回归模型中的适当变量。这种方法的目的是最小化多重共线性对回归系数估计的影响并实现简约性。通过使用统计软件SPSS(社会科学统计包,版本10.0)进行数据分析。分析中包含的变量的描述性统计可以在其他地方找到。
-
结果和讨论
- 臭氧数据的分析
表1a,b分别显示了研究中白天和夜晚时间数据的变量的皮尔逊相关系数矩阵。统计显著的相关系数(P lt;0.001)以粗体突出显示。在白天和夜晚时段,臭氧浓度都与,,,,,和呈负相关。由于这些污染物是臭氧的已知前体,结果符合预期,这表明臭氧浓度的升高与,,,,,和水平的下降有关。臭氧与,,,,之间的负相关性特别高。在白天,臭氧与风速、相对湿度和灰尘呈微弱的负相关,与风向、温度和太阳能呈正相关。后者中影响最大的是太阳能,其次是风向。除温度外,臭氧与夜间时间内各种气象变量之间的相关系数大多为正值。总体而言,臭氧与气象变量的相关性通常较弱。表1a,b还显示了不同变量之间的互相关。例如,正如预期的那样,温度和相对湿度之间的相关性是负的并且高度显著。
表1 不同变量的Pearson相关矩阵
-
- 多元回归分析
臭氧是次要污染物,其环境空气浓度受两组独立因素的影响:主要污染物的排放率和气象条件。众所周知,臭氧产生速率以复杂的方式与这些因素有关。作为第一近似,进行臭氧浓度的多元线性回归建模,以找到作为预测变量的污染物浓度和气象变量的预测方程,回归假设大致满足。自变量,,,,,,,悬浮尘(污染物),风速,风向,温度,相对湿度和太阳能(气象),采用逐步多元回归方法按照影响程度排序,目的是找到最符合臭氧数据的变量。进行两次单独的回归分析,每个数据集一次。表2a,b分别给出了白天和夜晚数据集的分析结果。多重可决系数给出了由模型中的自变量解释的臭氧浓度的变化比例。表格显示,当七个最佳变量拟合臭氧数据时,对于白天和夜晚的观察值,修正的值大致相同(0.69和0.68)。这意味着,在这两种情况下,臭氧浓度变化接近70%由表中列出的独立变量解释。两种模型中的共同变量是污染物,和以及。虽然白天臭氧浓度的主要前体似乎是,但在夜间是。在气象变量中,太阳能水平倾向于对白天的高臭氧浓度有显著贡献,而风速和温度与夜晚臭氧浓度更相关。
与Abdul-Wahab等人(1996)的观点相符,我们发现通过对白天臭氧浓度数据进行对数变换,回归模型的表现得到了显着改善。表2c,d展示了在回归中使用臭氧浓度的对数的结果。从这些表中可以看出,白天的修正可决系数从原始数据的68.6%增加到的变换数据的82.8%。然而,夜晚的修正可决系数大致相同。
表2 使用原始自变量预测(a,b)和 (c,d)的线性回归模型
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[20052],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。