相关分析在异常检测中的应用研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:daguofan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究相关分析方法在异常检测中的应用,并将其应用于特征选择及地震特征数据的异常检测中。主要研究内容如下:提出了一种基于离散粒子群算法(Binary Particle Swarm Optimization,BPSO)及以重叠信息熵(Overlap Information Entropy,OIE)为适应值函数的特征子集选择方法。该方法是不依赖于分类器的特征选择方法。主要思想是:首先随机产生若干粒子,以特征属性集与类别属性之间的OIE作为BPSO算法的适应值函数,其大小表示所选特征子集与类别属性之间相关性程度的高低;利用BPSO算法对特征子集进行优化,最终确定与类别属性的OIE最大的特征子集为最优特征子集。实验结果显示:该方法不仅能有效地寻找到最优特征子集,且能进行特征降维和去除冗余信息,其分类结果不差于全部属性的分类结果。提出了一个非线性新相关信息熵的概念,推导并证明了该信息熵的若干性质,这些性质满足香农熵的基本性质。新相关信息熵是一种度量多变量、非线性系统的相关性程度大小的标准。作为多变量之间相关关系的不确定性度量,变量间的相关性程度越大,对应的新相关信息熵值越小。新相关信息熵的提出为相关分析理论的研究提供了一种新方法和新思路。新相关信息熵的应用实例结果说明它是一种有效且有用的度量非线性系统不确定性的方法。基于上述研究,开发了用数据挖掘技术进行地震趋势预报与评判的分析软件原型系统,此系统的开发目的旨在为后续的进一步研究打下基础。本文的研究结果主要开发了其中的相关分析模块,同时提供给用户可视化的操作界面,其主要功能是进行特征选择和异常检测,以此评判本文特征选择方法的有效性。以汶川余震特征数据为实验数据,测试结果表明该系统功能正确。
其他文献
近年来,互联网搜索引擎得到迅猛发展和广泛普及,但大粒度输入的搜索需求被各大搜索引擎所忽视;而且,尽管用户通过搜索引擎能够快速检索出大量文档,但返回的文档中往往只有少
学位
网络附属存储系统是一种特殊的专用数据存储系统,在使用、管理、维护上都具有简单、方便、可扩容、大吞吐量等优良的特性,可提供跨平台文件共享功能,是存储机载数据的理想环
目前,信息技术、网络技术发展迅速,但企业和政府部门在以往开发信息系统时缺乏统一的部署,异构问题的因此日益严重,数据交换困难,形成了信息孤岛问题。在信息化的趋势下,迫切
大规模开放在线课程(massive open online courses, MOOC)作为一种新兴的教育模式,自2012年以来,随着美国Coursera、Udacity、edX三大课程提供商的兴起,迅速在全球掀起一股在
近年来云计算和大数据应用的发展如火如荼,作为其基础设施的大规模数据中心等网络设备的能量消耗问题越发凸显。当今网络中普遍存在着大量的路径冗余,链路利用率不均衡和非常
全文信息检索技术是当前时代迅速获得准确信息的重要手段之一。在全文信息检索技术中最重要的部分是索引的管理。大数据时代,集中式的索引管理方式面临巨大挑战,最佳的解决方
面对越来越丰富的IT (Information Technology,信息技术)资源,越来越复杂的IT环境,无论企业还是政府的IT部门都开始广泛采用ITIL (Information Technology Infrastructure Li
随着无线通信技术的迅速发展,越来越多的人们希望提供无处不在的、高质量的无线通信,无线接入技术也得到了迅速的发展。无线MESH网络就是一种新型的宽带无线接入系统,是一种
长期以来,织物CAD技术一直是计算机在纺织领域中的一个重要应用与研究方向,织物CAD作为高新技术的手段为纺织品的设计和生产提供了很大的方便。织物的外观模拟在设计阶段就能