【摘 要】
:
近年来,社会的飞速发展,伴随而来的就是大量的数据的产生。对于这些海量的数据,人们希望能过其中的大部分数据找出某些规律来指导人们日常的行为。在这个过程中,人们大多数情
论文部分内容阅读
近年来,社会的飞速发展,伴随而来的就是大量的数据的产生。对于这些海量的数据,人们希望能过其中的大部分数据找出某些规律来指导人们日常的行为。在这个过程中,人们大多数情况下都认为只有那些大量相似的数据才会包含某种重要信息,从未忽略了某些少数样例。然而,正是这些被人们认为无用的数据可能包含着人们没有发现的更重要的信息。正是由于这个原因,人们提出了异常点挖掘算法。异常点挖掘又被称为离群点分析、异常检测,是数据挖掘技术的一个重要方面。目前,已经有很多种异常点挖掘算法被人们提出,最被人们熟知的有基于距离的和基于密度的挖掘算法。但是两种算法都具有一些不足之处,它们不适用于一些高维数据。本文提出了一种基于神经网络的异常点挖掘算法,该算法利用神经网络来对数据进行分类,再结合信息熵来判断数据是否为异常点,避免了其它异常点挖掘算法的一些不足之处。最后,在一些数据集上进行了试验,并对结果进行了分析。实验结果表明,该算法可以有效的发现数据中的异常点。
其他文献
神经网络是机器学习中最重要的模型之一,它基于无次序、无规则的样本数据集,试图从中提取出描述此样本数据集特征的数学模型。其中,BP神经网络因其结构简单、算法易于实现且
目前,XML文档数据得到越来越多的应用,尤其是在Web应用中。随着XML基准的不断改进以及XML文档应用数量和规模的日益增大,在这些应用的测试中对XML文档数据的需求,无论是数量上,还
网络的发展如今已广泛应用在各个领域中,针对于高等院校的素质教育,教学改革和考试改革势在必行,应用WEB技术的在线考试则成为当前众多学校改革的发展方向。因此,专业系统软件应
支持向量机在处理概率空间上的实随机变量的大量分类问题中体现了许多优势,然而它难以处理现实生活中客观存在的非概率空间上的非实随机变量的分类问题。基于此,本文提出了一
随着IT技术的发展,生物识别技术已经成为一个研究的热点领域。各国政府都纷纷资助生物识别技术方面的研究,该领域方面的学术会议吸引了政府和业界众多的参与者,理论研究的成果正
随着现代科技的发展,计算机被越来越多地应用于日常生活中,随之产生的是各类院校中计算机基础课程的广泛普及。计算机基础课程主要训练常用办公软件(Office)的操作技能,具有实践
随着经济的全球化、信息化和服务化,IT建设逐渐由技术转向业务,而业务交付不及时、缺少统一规划、应用间共享困难、功能个性化不足、开发低成本和高要求的矛盾导致企业应用系统
随着信息化时代的迅速发展,信息检索逐渐被人们看作为一个关注的热门话题,而对与检索系统的评价来说,在信息检索技术的发展有了巨大的影响。如今,维吾尔文网页也逐步推动,扩大。在
手机通讯时人类历史上迄今为止最为便捷的通讯手段,它有随时,随地,随身的特点,已经成为第五媒体。在一些偏远地方,手机可弥补传统业态渠道在时间和空间的不足。短信、彩信及w
随着社会和网络技术的发展,产生了大量的图像信息。如何对这些图像进行分类、存储和检索,一直是目前计算机技术的一个研究的热点。由于图像基于情感的分类检索可以极大的提高