BP神经网络在环境污染数据挖掘中的应用

来源 :科学与财富 | 被引量 : 0次 | 上传用户：ZWDragon

【摘要】

：

【作者】

：

姚瑶赵瑞雪邱俊强

【出处】

：

科学与财富

【发表日期】

：

2019年20期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：主要介绍了神经网络的中BP神经网络的内容，结合BP神经网络可用训练人工神经元进行数据的分类和预测的特点，分析探讨了BP神经网络在环境污染数据挖掘中的应用。
　　关键词：数据挖掘；神经网络；BP算法
　　引言：随着计算机网络和信息技术的高速发展，如何从海量数据中提取有用信息成为当务之急. 数据挖掘正是为顺应这种需要而发展起来的信息处理技术. 它借助某些专门算法，利用计算机从海量数据中提取有用的信息，揭示某些隐藏规律，从而有效预测和正确指导未来的工作. [1] 分类是数据挖掘的主要功能之一，它通过分析类，标记已知的训练数据集，导出描述并区分数据类或概念的模型函数，以便能使用该模型预测类标记未知的对象类. [1] 人工神经网络（ ANN ，Artificial Neural Network）是20 世纪 80年代后期迅速发展起来的人工智能技术. 它对噪声数据具有很高的承受能力，对未经训练的数据具有分类模拟的能力，因此在网站信息、生物信息和基因以及文本的数据挖掘等领域得到了越来越广泛的应用. 在多种 ANN 中，反向传播（ BP，Back-Propagation）网络是应用最广的一种形式[3] .
　　1.神经网络定义
　　（1）生物神经网络主要是指人脑的神经网络，它是人工神经网络的技术原型。人脑是人类思维的物质基础，思维的功能定位在大脑皮层，后者含有大约1011个神经元，每个神经元又通过神经突触与大约103个其它神经元相连，形成一个高度复杂高度灵活的动态网络。作为一门学科，生物神经网络主要研究人脑神经网络的结构、功能及其工作机制，意在探索人脑思维和智能活动的规律。
　　（2）人工神经网络是生物神经网络在某种简化意义下的技术复现，作为一门学科，它的主要任务是根据生物神经网络的原理和实际应用的需要建造实用的人工神经网络模型，设计相应的学习算法，模拟人脑的某种智能活动，然后在技术上实现出来用以解决实际问题。因此，生物神经网络主要研究智能的机理；人工神经网络主要研究智能机理的实现，两者相辅相成
　　（3）BP神经网络
　　BP （Back Propagation）神经网络是一种神经网络学习算法。其由输入层、中间层、输出层组成的阶层型神经网络，中间层可扩展为多层。相邻层之间各神经元进行全连接，而每层各神经元之间无连接，网络按有教师示教的方式进行学习，当一对学习模式提供给网络后，各神经元获得网络的输入响应产生连接权值（Weight）。然后按减小希望输出与实际输出误差的方向，从输出层经各中间层逐层修正各连接权，回到输入层。此过程反复交替进行，直至网络的全局误差趋向给定的极小值，即完成学习的过程。
　　2. 人工神经元（ Artificial Neuron ）模型 [2]
　　人工神经元是神经网络的基本元素，其原理可以用下图表示：
　　图中x1～xn是从其他神经元传来的输入信号，wij表示表示从神经元j到神经元i的连接权值，θ表示一个阈值（ threshold ），或称为偏置（ bias ）。则神经元i的输出与输入的关系表示为：
　　图中 yi表示神经元i的输出，函数f称为激活函数（ Activation Function ）或转移函数（ Transfer Function ），net称为净激活（net activation）。若将阈值看成是神经元i的一个输入x0的权重wi0，则上面的式子可以简化为：
　　若用X表示输入向量，用W表示权重向量，即：
　　X = [ x0 ， x1 ， x2 ， ....... ， xn ]
　　则神经元的输出可以表示为向量相乘的形式：
　　若神经元的净激活net为正，称该神经元处于激活状态或兴奋状态（fire），若净激活net为负，则称神经元处于抑制状态。
　　图1中的这种“阈值加权和”的神经元模型称为M-P模型（ McCulloch-Pitts Model ），也称为神经网络的一个处理单元（ PE， Processing Eleme
　　3.激活函数
　　在神经网络中，网络解决问题的能力与效率除了与网络结构有关外，在很大程度上取决于网络所采用的激活函数。激活函数的选择对网络的收敛速度有较大的影响，针对不同的实际问题，激活函数的选择也应不同。
　　常用的激活函数有以下几种形式：
　　（1）阈值函数：该函数通常也称为阶跃函数。当激活函数采用阶跃函数时，人工神经元模型即为MP模型。此时神经元的输出取1或0，反應了神经元的兴奋或抑制。
　　（2）线性函数：该函数可以在输出结果为任意值时作为输出神经元的激活函数，但是当网络复杂时，线性激活函数大大降低网络的收敛性，故一般较少采用。
　　（3）对数S形函数：对数S形函数的输出介于0～1之间，常被要求为输出在0～1范围的信号选用。它是神经元中使用最为广泛的激活函数。
　　（4）双曲正切S形函数：双曲正切S形函数类似于被平滑的阶跃函数，形状与对数S形函数相同，以原点对称，其输出介于-1～1之间，常常被要求为输出在-1～1范围的信号选用。
　　4.神经网络模型 [3-6]
　　神经网络是由大量的神经元互联而构成的网络。根据网络中神经元的互联方式，常见网络结构主要可以分为下面3类：
　　（1）前馈神经网络（Feedforward Neural Networks ）
　　前馈网络也称前向网络。这种网络只在训练过程会有反馈信号，而在分类过程中数据只能向前传送，直到到达输出层，层间没有向后的反馈信号，因此被称为前馈网络。感知机（ perceptron）与BP神经网络就属于前馈网络。
　　图4 中是一个3层的前馈神经网络，其中第一层是输入单元，第二层称为隐含层，第三层称为输出层（输入单元不是神经元，因此图中有2层神经元）。　　对于一个3层的前馈神经网络N，若用X表示网络的输入向量，W1～W3表示网络各层的连接权向量，F1～F3表示神经网络3层的激活函数。
　　那么神经网络的第一层神经元的输出为：
　　O1 = F1（ XW1 ）
　　第二层的输出为：
　　O2 = F2 （ F1（ XW1 ） W2 ）
　　输出层的输出为：
　　O3 = F3（ F2 （ F1（ XW1 ） W2 ） W3 ）
　　若激活函数F1～F3都选用线性函数，那么神经网络的输出O3将是输入X的线性函数。因此，若要做高次函数的逼近就应该选用适当的非线性函数作为激活函数。
　　（2）反馈神经网络（ Feedback Neural Networks ）
　　反馈型神经网络是一种从输出到输入具有反馈连接的神经网络，其结构比前馈网络要复杂得多。典型的反馈型神经网络有：Elman网络和Hopfield网络。
　　（3）自组织网络（ SOM ，Self-Organizing Neural Networks ）
　　自组织神经网络是一种无导师学习网络。它通过自动寻找样本中的内在规律和本质属性，自组织、自适应地改变网络参数与结构。
　　5.神经网络的研究可以分为理论研究和应用研究两大方面。
　　（1）理论研究可分为以下两类：
　　1）、利用神经生理与认知科学研究人类思维以及智能机理。
　　2）、利用神经基础理论的研究成果，用数理方法探索功能更加完善、性能更加优越的神经网络模型，深入研究网络算法和性能，如：稳定性、收敛性、容错性、鲁棒性等；开发新的网络数理理论，如：神经网络动力学、非线性神经场等。
　　（2）应用研究可分为以下两类：
　　1）、神经网络的软件模拟和硬件实现的研究。
　　2）、神经网絡在各个领域中应用的研究。这些领域主要包括：
　　模式识别、信号处理、知识工程、专家系统、优化组合、机器人控制等。随着神经网络理论本身以及相关理论、相关技术的不断发展，神经网络的应用定将更加深入。
　　6. BP神经网络在环境污染数据挖掘中的应用
　　通过上文对BP神经网络的模型介绍可知，BP神经网络具有反馈传输误差，修正权值，最终形成适合其他数据应用的神经网络的特点。BP神经网络这一特性在大数据环境下可有效利用。而环境污染方面的数据正是庞大而实时变化的大数据环境，面对这样的大数据环境，有效应用BP神经网络可对环境污染数据进行分类预测。由此提出这样的应用思想：将近几年的环境污染数据，例如五大空气质量数据PM2.5，PM10，NO2，SO2，O3数值作为BP神经网络的输入数据集，相对应的环境指标AQI值作为BP神经网络输出数据集，利用BP神经网络反馈传输修正误差形成可预测环境指标AQI值的神经网络。笔者应用C语言简单地构造了BP神经网络分类器，并应用2016-2017南京环境污染相关数据训练神经网络，得到可执行程序。但是由于BP神经网络分类器有待优化，预测结果不准确。结果截图（如图6-1）如下：
　　7.结束语
　　通过本文对神经网络的介绍以及对BP神经网络在环境污染数据挖掘中应用的探讨，BP神经网络应用领域可大大扩展，尤其对环境污染数据挖掘中相关应用。针对BP神经网络在数据挖掘中的应用，对于环境污染方面不仅仅可实现环境污染指标的预测，而且极大可能可实现大数据污染程度的分类等等，这仍有待探究。
　　参考文献：
　　[1] HAN J，KAMBER M. Data Mining： Concepts andTechniques[ M] . Morgan Kaufmann Publishers，2001.
　　[2]张天舟.基于 GABP算法的复杂计算机网络安全评价中的应用【D】.电子科技大学，2015
　　[3]刘钊，蒋良孝. 基于神经网络的数据挖掘研究 [ J] . 计算机工程与应用，2004，40（ 3）： 172-173，190
　　[4]朱伟刚，徐超.BP神经网络算法在长春地铁二号线地表沉降预测中的应用【J】.长春工程学院.2018
　　[5] 马仕.BP神经网络在地层预测中的应用研究【D】.河北工业大学.2016
　　[6] 董明明.蒋涛.数据挖掘中BP神经网络与决策树技术的应用研究【J】.扬州大学.2018
　　[7] 莫礼平.樊晓平，BP 神经网络在数据挖掘分类中的应用【D】，中南大学信息科学与工程学院，2006
　　*双创项目：南京审计大学金审学院双创项目201813994005Y

其他文献

基于Spark+遗传算法智能组卷方法

摘要：随着计算机应用技术的不断发展，由计算机与教育相结合而产生的计算机辅助教育系统得到了快速发展。在目前的素质教育下，考试仍然是衡量教师教学能力和学生学习成绩的主要衡量标准之一，同时不同层次的考试对试卷衡量标准也是不尽相同的。那么，如何依靠算法组出一套科学合理且高质量的试卷是评定计算机与教育结合效果的手段之一。因此，对高效智能组卷算法的研究是非常具有实际应用价值的。　　关键词：计算机辅助教育；智

期刊

箱筒型基础栈桥结构在埕海二区海洋工程中的应用

摘要：针对大港滩海海况和地质条件，为实现进海路两侧的水体交换，保护海洋环境，在埕海二区海洋工程建设中，采用了新型环保的箱筒型基础栈桥结构。箱筒型基础栈桥结构总长158米，由8组箱筒型基础结构、桥墩柱、横梁、路面板组成。经后期使用发现，箱筒型基础结构稳定性好、承载力高、沉降量小、透流效果好，工程投资较低，适用于软土地基，应用前景好。　　关键词：箱筒型基础；栈桥；进海路；埕海二区海洋工程；

期刊

连续运行参考站系统在城市水文测绘中的应用研究

摘要：随着连续运行参考站系统（CORS）的创始，对很多城市都产生了深远的影响，特别是苏州市。由于该测量系统改变了原本测量系统，并且连续运行参考站系统的优点十分显著而且多，所以连续运行参考站系统在城市水文测试中应用的广泛程度也在一直加强。本文联合了连续运行卫星定位综合服务系统的技术原理和它的优势点，以南京某些地区为例，从原理到详细操作中具体论述了连续运行卫星定位综合服务系统在城市水文测绘中的实践，

期刊

GIS在水文水资源领域中的应用现状与发展趋势探析

摘要：水资源对人类生产至关重要，如何能更加合理的开发、利用、保护水资源是人类永恒的话题。随着现代技术的发展，新的GIS技术使人类对水文水资源的监测研究迈入了更高的台阶，本文主要讲述了GIS在水文水资源领域中所发挥的作用与应用现状，并探讨了GIS在该领域未来应用发展趋向，旨在为我国水文水资源工作提供更好的技术支持和保障。　　关键词：GIS技术；水文水资源；应用进展；发展趋势　　1 GIS的概念与功

期刊

基于Python的图片文本识别系统的研究

近年来随着计算机技术的不断发展，Optical Character Recognition（光学字符识别，简称“OCR”）应用的领域更加的广泛，而图片文字识别就是其中重要的一个。目前图片文字识别的准确率并没有达到100%，这也成为了图片文字识别发展领域的一大瓶颈，因此要去探索一个好的图片文字识别算法是非常有意义的。　　图片文字识别系统的基本流程为：获得图片、去噪处理、二值化处理、矫正图片、行查找、

期刊

管理科学与工程的实际应用

摘要：近些年，我国的社会经济不断发展，促进了城市化进程的不断完善，社会各界居民对工程建设质量有着越来越高的要求。工程施工建设单位只有不断提升自身的管理水平，才能够在确保工程建设质量的基础上尽可能地降低工程的施工建设成本，提升施工建设效率，从而满足社会各界居民的实际需求。本文通过笔者在工程管理中多年的工作实践经验，对管理科学与工程的实际应用进行深入的分析。　　关键词：管理科学；工程；应用　　引言　

期刊

论新型过滤缸筛网应用

摘要：在石油工程领域，向地下注水或管道输送的液体需要依靠离心泵提供动力，加压后再注入地下或输送到其他区域，离心泵的安全平稳运行[1]离不开过滤缸，因为液体中如果混入颗粒物质长时间沉积会堵塞通道和磨损泵的叶轮，所以在管道进口处会加装过滤缸对输送液体进行过滤，以期将杂质滤掉，将合格的液体注入地下或送入管道。这款应用于过滤缸内部的新型筛网与过滤缸底部堵头改为排污阀的改进，有着结构上和功能上的优势，解决

期刊

网络信息安全隐患及安全技术应用研究

摘要：近些年，随着社会经济的不断发展，促进了科学技术的不断进步，网络信息技术的诞生与发展，不仅掀起新的科技浪潮，更改变了人们的生产生活方式。进入大数据时代之后，网络信息技术再次走上发展巅峰，功能更加完善，应用范围进一步扩大。然而在快速发展的同时，网络信息技术也因存在诸多隐患而威胁着用户的信息安全，为此，必须明确网络信息安全技術及其应用环境，才能保障用户的切身利益免受损害。　　关键词：网络信息；安

期刊

茅台、五粮液企业竞争优势分析

摘要：茅台与五粮液是白酒行业的领军企业，分居第一、第二，本文试图基于SWOT的品牌策略分析，从多维度维度对比两者品牌策略得失，以解释为何白酒行业的第一与第二间存在较大差距，为白酒企业管理者提供参考。　　关键词：白酒行业；品牌策略；SWOT　　茅台和五粮液是当前中国白酒市场最具有竞争力的两家企业之一，在竞争过程中，两家企业形成各自独特的核心竞争力和优势，而品牌是竞争中重要因素之一。在制定企业品牌策

期刊

电气自动化控制系统发展趋势与建议

摘要：目前我国对工业化领域进行大规模的发展，作为工业化领域核心内容的电气自动化自然也随之不断进步。文章从三个方面对电气自动化进行了研究：电气自动化的现状；电气自动化的发展趋势；电气自动化发展的合理化建议。　　关键词：电气自动化；工程控制；重要性　　前言　　时代发展至今天，国内各行各业都在科技的推动下得到了空前的进步，以经济建设为主的发展理念得到了人们充分的认可。国家要想在国际上占有一席之地必须强

期刊

BP神经网络在环境污染数据挖掘中的应用

与本文相关的学术论文