利用人工神经网络的应用预测污水处理厂的化学需氧量
原文作者 Sani Isa Abba 单位 aEngineering 学院
摘要:由于耗时的生物需氧量(BOD)测试,化学需氧量(COD)已用于确定洗浴水,废水和天然水中有机物的含量,因此COD成为控制处理过程的替代方法。对于有机和无机物质的氧化,COD可以表示为需求参数之一。本文采用人工神经网络(ANNs)开发和估算污水处理厂(WWTP)的出水COD模型,对模型进行评估,每日记录的数据集来自新的尼科西亚WWT,输入人工神经网络的输入参数为入口COD,BOD,pH,电导率,总氮(TN),总磷(TP),总悬浮固体(TSS),悬浮固体(SS)和出水COD。采用统计技术(确定系数,均方根误差,相关系数)对人工神经网络进行评估,将人工神经网络模型的结果与多元线性回归分析(MLR)进行比较,结果表明人工神经网络模型更适合于在预测人工神经网络在MLR模型上预测流出物COD。
关键词:化学需氧量;人工神经网络;污水处理厂;多线性回归分析
1.简介
由于释放的各种化学品的数量众多,城市污水是污染环境的主要污染源之一。因此,为了估算出水的性能,对于控制污水处理厂的复杂过程(Dogan等,2015),对可靠模型的需求是至关重要的。COD是指示应用于废水和地表水的有机污染的最广泛使用参数之一。它被定义为氧气需要微生物在标准温度下对废水中的溶解固体或有机物质进行生物分解。作为BOD的替代品,COD的测量可用于以下目的:确定污水处理设施的规模,污水的强度和某些处理厂的效率(Jain,2014)。化学需氧量是分析水质参数的必要参数,因为它提供了评估排放对受纳水体影响的指标。COD水平越高,样品中有机化合物的氧化越高,这将最终降低溶解氧(DO)水平。随后DO的减少会进一步导致厌氧条件,这对水生生物是有害的(Jain,2014)。
由于对环境和公共卫生问题的严重关切,污水处理厂(WWTP)的污水质量变得更加重要(Hamedetal。,2004)。污水处理厂的特点是动态性强,涉及多个复杂非线性过程,难以用线性统计或数学模型预测或解释。然而,便捷的建模过程在描述系统中发生的一般相互作用中发挥着至关重要的作用(Hamedetal。,2004)。人口增长的快速增长导致了城市化发展,农业和工业活动的发展以及废水的突出改善都增加了水污染水平。因此,提供水质非常困难和资源消耗(Nourani等,2013)。为了提高出水水质并达到常规标准,从污水处理厂降低运行和维护成本的同时,采用先进技术的重点需要落实到位。在这种情况下,大多数用于出水质量的确定性和数值模型都不能相应地预测(Paietal。,2011;Goyaletal。,2015)。由于处理过程的复杂性,这要求达到不同物理和生化参数的期望标准极限的高精度,这是实现污水质量的主要挑战。同时,用实验模型评价水质的昂贵性和耗时成为迫切需要解决的问题。因此,软计算技术现在已经应用于处理不确定性概念,并克服了实验模型的不足(Nourani等,2013)。
因此,神经网络方法在建立水文和污水处理过程中已经得到了重要的考虑,近年来人工神经网络被用作非线性相互作用的有效预测,控制,监测,预测,分类和模型模拟的方法。人工神经网络能够考虑多输入和输出参数,自学习,并行处理,复杂函数关系中的自适应,已经在任何应用中实现(Bagherietal。,2015;Nouranietal。,2013;Dursun,2010)。许多研究人员成功地使用ANN模型来预测,分类或优化各种水质参数。参考文献(Dogan等,2015)使用ANN估算了废水处理进口的生物需氧量。参考文献(Nourani等,2015)使用人工神经网络来模拟地下水。参考文献(Areerachakul等,2011;Djeddou和Achour,2015)利用人工神经网络预测城市污水处理厂的污泥体积指数。
该研究被有意用于确定人工神经网络在预测尼科西亚污水处理厂COD的效率和性能方面与实验模型相比较,得出一个可行的模型,可用作质量监测和性能的一般模型处理厂。
2.实验材料和研究方法
2.1人工神经网络的基础
人工神经网络是一种设计用于模拟人类大脑功能的设备。它是一个大规模并行的分布式处理器,能够存储巨大的实验数据并使其可用。最常见的应用是特征提取,模式识别和分类(Kuo等,1995)。人工神经网络是非线性数学和统计建模工具;这对解决各种工程领域的问题很有用。它由大量高度处理器和相互关联的元素(神经元)组成,同时解决大量动态数据的问题(Hamed等人,2004;Dogan等人,2015)。
人工神经网络由节点组成。这些通过突触(链接)相互连接的节点接收输入数据,这些数据被处理以产生输出。调整和更新突触权重和偏差的过程使得对于给定的输入实现期望的输出被称为学习过程(算法),其用于减少观察到的和预测的目标之间的误差。在人工神经网络的各种分类中,前馈神经网络(FFNN)是最常见的一种,其中从输入层经过隐藏层(中间层)到输出层的数据流通常从左到右或从下到上。目前的工作采用反向传播训练算法(BP)的FFNN(Nourani等,2009;Gaya等,2014;Nourani等,2013)。在FFNN的背景下学习通常与反向传播算法有关,后者也被称为多层感知器(MLP)。BP的主要概念是根据每个神经元的总权重来确定产生目标的权重;将实际的目标与期望的目标进行比较。两者之间的区别被称为错误,它被传播回输入层(Gayaetal。,2014;Nouranietal。,2013)。如图1所示,人工神经网络的体系结构(I , j , k),其中,I , j和k节点分别代表输入层,中间层和输出层,目前的工作被认为是MLP,它已经被应用以解决许多不同的问题,以演示输入与目标之间的非线性函数。
图1:MLP的架构
2.2人工神经网络的评估
在人工神经网络中,没有确切的可用公式来决定人工神经网络的有效结构和哪种训练算法将解决给定的问题,最好的解决方案是通过反复试验来获得。在这种情况下,选择输入变量的知识对人工神经网络建模非常重要。首先要考虑重要的关键参数,避免模型中不必要的参数。在这项工作中,考虑敏感性分析,以便找出参数的重要性并确定关键参数。为了更好地表现人工神经网络,应该避免在期望目标上出现无意义的变量(Nourani,2012;Dogan等,2015)。
为了产生与目标输出近似的期望输出的神经网络,需要进行训练或学习过程(Kuo等,1995)。输入和输出数据用于ANN训练,分配,更新和调整权重和偏差连接的技术直到学习完成为止称为学习过程。初始权重通常在仿真过程中随机分配,质量和数量两方面的数据越大,训练越好,因为缺乏足够的数据可能会导致过度拟合(过度学习),这是学习中发生的主要问题之一此外,缺乏适当数量的隐含神经元和不合适的时期(迭代)也会导致过拟合,小节点也可能导致拟合不足,而许多节点会导致过度拟合隐藏层(Dogan等,2015;Dursun,2010;Sharifi等,2009)。
然而,每层都是由神经元组成的,神经元通过权重与其他神经元相互连接。在每个神经元中引入激活函数以便将线性函数转换为数学函数的非线性函数。该功能适用于处理神经元并定义神经元如何被激活;它也接受来自前一层的输入并产生输出到下一层。用于本工作目的的激活函数是一个S型激活函数,在方程(1)中定义;这是持续的非线性指数函数,逐渐在0和1之间切换(Dogan等,2015;Nourani等,2015)。
(1)
在本文中,多层感知器模型由于其在水文学的不同文献中的出色表现而被Lavenberg-Marquardt算法训练(Kuo等,1995;Sharifi等,2009)。使用等式(2),通常,在训练模型之前的初始阶段,将数据从0和1的范围标准化。规范化是为了减少数据冗余并提高数据完整性而完成的。采用人工神经网络和人工神经网络模型对污水处理中COD进行估算,采用FFNN法和BP神经网络反向传播误差算法,将训练和检验分别分为70%和30%。
(2)
其中“XIrsquo;”为标准化量,“xi”为非标准化量,“xmin”,“xmax”分别为最小和最大数据量。
用于确定模型开发的效率和性能的标准取决于具体问题,所使用的统计性能评估是确定系数(D或R2)和均方根(RMSE)。RMSE和R2显示了测量值和计算值之间的差异,对于最佳网络,D和RMSE值在训练和验证中都应该高,D越高,正常情况下RMSE越低。以下等式(3)和(4)用于确定参数(Nourani和Sayyah,2012;Pai等,2011)。
其中,CODo,CODp和,分别是测量数据,估计值和N个测量值的平均值。RMSE是用来评估模型的有效性及其作出精确预测和决策的能力的标准,当RMSE朝向零值时,它提供了度量与计算值之间的最佳拟合。它的范围从最佳估计为零,并且预测和测量之间的差异变得越来越大(Nourani等,2013)。
2.3尼科西亚污水处理厂和敏感性分析
新的尼科西亚污水处理厂的设计目的是为阶段1的27万居民提供2025年的设计年限。为了避免消费者对未使用的能力收取额外的容量附加费,实施阶段分为1和2阶段。将实施30,000立方米/天的容量和2号阶段,以达到最终容量45,000立方米/天。基于膜生物反应器(MBR)技术的新型植物。膜技术基本上在过去几年内发展起来。它是一种用于废水处理的先进技术,新工厂已被设计成具有先进生物去除营养物质(ABMR)的MBR工厂。它现在是欧洲第二大使用膜技术的污水处理厂(联合国开发计划署,2013年)。
在这项研究中,尼科西亚污水处理厂的日常废水数据是从尼科西亚市政废水管理局获得的2014年至2016年,进行数据处理和采矿以去除嘈杂和未记录的数据集,数据包含312条记录每条记录由8个参数组成。
2.4多元线性回归(MLR)分析
在回归中,一个变量被假定为依赖参数Y,另一个作为独立变量X,其中线性方程被考虑用于该关系。多元线性回归方程可以被认为是在方程(5)中,
Wherealpha;,beta;1,beta;2hellip;beta;n是回归系数,
y显示当X1=x1,x2,x3hellip;xn时Y变量的预测值。
我们需要考虑我们的预测值(P值),并排除任何多元线性回归分析中的所有微不足道的值(Dogan等,2015)。
表格1每个输入参数的数据集的统计分析
<td
剩余内容已隐藏,支付完成后下载完整资料</td
英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[279365],资料为PDF文档或Word文档,PDF文档可免费转换为Word
参数 |
Mean |
Max |
Min |
Variance |
Standarddeviation |
CorrelationwithCOD |
pH |
3.1019 |
8.2 |
5.6 |
0.0684 |
0.2616 |
-0.1576 |
BOD(mg/l) |
53.7660 |
616 |
105 |
7945.68 |
89.138 |
0.1793 |
COD(mg/l) |
961.3846 |
1463 |
385 |
24706.49 |
157.183 |
1.000 |
T-N(mg/l) |
3.5406 |
143 |
30.54 |
707.646 |
26.6016 |
0.2478 |
T-P(mg/l) |
1.0801 |
14 |
8 |
0.916129 |
0.9571 |
0.2578 |
SS(mg/l) |
7.0047 |
100 |
3.37 |
67.3643 |
8.2075 |
0.2604 |
TSS(mg/l) |
20.8205 |
660 |
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。
您可能感兴趣的文章
- 黄土丘陵沟壑区土地利用变化对退耕还林工程的响应及驱动力分析外文翻译资料
- 菲律宾大马尼拉市区边缘的城市化进程与农业景观格局的变化外文翻译资料
- 利用Landsat 8 OLI和谷歌地球云计算来绘制新西兰的湖泊和水库的自动探测算法外文翻译资料
- 长三角城市群时空异质性分析—一基于夜间灯光数据的证据外文翻译资料
- 首尔地铁集水区土地利用特征及其对地铁客流的影响外文翻译资料
- 通过层次聚类的服务站用于公用设施选择的GIS锚定系统外文翻译资料
- 体育活动设施的空间可及性与体育活动频率的关系;苏格兰中西部的家庭社区和工作场所社区相比如何?外文翻译资料
- 建筑环境对交通事故的影响:基于网络的GIS分析外文翻译资料
- 1400-1625年前工业化时期北海地区风暴频率的重建及其与重建的温度时序的联系外文翻译资料
- 希腊北部的冰雹频率、分布和强度外文翻译资料