论文部分内容阅读
人类可持续发展离不开水资源,水生态也与人类社会健康发展息息相关。近些年来,长江流域频繁爆发水环境污染事故,严重威胁社会稳定和水生态安全。三峡库区保持健康的生态环境是长江流域地区经济稳定与发展的重要保障,同时也是地区社会安全、稳定的必要因素。本文主要基于聚类思想和异常点在局部密度所呈现的特征,提出了基于局部密度极小值的异常检测算法,并做出了比较实验分析验证了所提出方法的有效性,将其运用到实际的三峡在线监测系统之中,本文的主要工作和创新点为:1.针对传统异常点检测算法,对参数敏感,精度不高,稳定性和可解释性效果相对较差的缺陷,本文提出基于局部密度极小值的异常检测算法。算法核心思想认为异常点的密度在局部一般是较小或者极小的,而且离那些比它们密度要高的点较远。该算法同时在结合了基于密度和基于距离的思想,具有较高的准确度、可解释性和稳定性,实验证明在不同形状的人工合成数据集中有良好的表现。2.本文在基于局部密度极小值的异常检测算法的基础上,针对水质数据的特点,着重对真实水质数据进行了时间区间划分处理,并进行了的异常数据挖掘工作。其中包括:基于SVR回归的数据缺失处理、数据标准化以及基于PCA的数据规约预处理,以及水质异常检测算法运用,最后给出了参数优化选择的意见。实验结果显示该方法可以检测出不同程度的水质异常。3.数据驱动的水质异常检测研究是制定三峡库区水污染控制规划和综合防治的基础工作。为了有效减少三峡库区水环境问题,本文运用提出的基于密度极小值异常检测算法来分析三峡库区水质数据,并将该算法集成于在线监测系统,为利用信息化手段感知三峡生态环境做出努力。本文对三峡库区水质异常检测方法的研究将有助于实现在线检测系统异常实时分析,为建立高度自动化、信息化的三峡水质预警系统奠定基础。