数据挖掘中空缺值预测算法的研究与实现

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:xiaoping123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术被广泛地应用于社会各个领域,数据挖掘的成功与否和适用性能在很大程度上取决于数据质量。在获取数据的过程中,无法避免空缺值的产生。空缺值的存在对数据质量影响很大,因此,空缺值预测是数据预处理中的重要工作,是提高数据质量的关键一步。本文首先分析和研究了具有代表性的灰色GM(1,1)预测空缺值算法和MVC预测空缺值算法。灰色GM(1,1)预测空缺值算法需要分别对各序列建立GM(1,1)模型,且不能充分利用序列之间的关联性,无法解决其间的复杂非线性关系,导致对空缺值的预测精度不高。MVC预测空缺值算法具有以关联规则所预测空缺值的精准率,但仍然有部分空缺值无法用已挖掘得到的关联规则来预测,未能够再深一层的解决空缺值的填补率及正确率的问题。本文对灰色GM(1,1)预测空缺值算法进行了改进,将灰色GM(1,1)模型和三层BP神经网络相结合,然后提出了灰色神经网络组合预测空缺值算法。灰色神经网络组合预测空缺值算法适合于小样本时序数据集,不仅考虑各序列数据之间的关系,还考虑了各序列之间的关系,省去了多个序列进行预测时对单个模型的检验,降低了运算的复杂度,提高了空缺值的预测精度,优于单一的预测模型。本文对MVC预测空缺值算法进行改进,引入了BP神经网络,然后提出了MVC-神经网路组合预测空缺值算法。MVC-神经网路组合预测空缺值算法适合于大样本数据集,充分利用了关联规则与BP神经网络的优点,考虑了填充空缺值的精准率,提高了空缺值的填补率及正确率。
其他文献
随着信息技术的发展,数据库技术得到了广泛的应用,促使业界人士对该项技术进行更为深入的研究。在数据库技术中有很多研究领域,数据库加密就是其中一个重要的研究方向,对它进行深
随着互联网技术、多媒体技术等信息技术的飞速发展,人类信息资源实现了高度共享,为高校信息化建设提供了机遇和条件,各高校正步入数字校园全面建设阶段。近年来Web服务技术在
随着计算机技术和网络通信技术的飞速发展,基于Internet的各种信息化平台在社会的各个领域都得到了越来越广泛的应用。特别是近年来,基于B/S模式的自测系统已经成为教育领域
面对浩如烟海的电子信息,如何帮助人们有效地收集和选择感兴趣的信息,如何帮助用户在日益增多的信息中发现潜在有用的知识,目前已成为信息技术领域研究的热点问题之一。数据
现代企业在生产经营过程中要面对庞杂的物流信息,处理和管理好这些信息,对企业降低运营成本,增强商品存储效率,加强客户服务起着重要的作用。物流管理信息系统是整个企业物流
分类学习是机器学习重要的研究内容。支持向量机(Support Vector Machine SVM)在众多分类算法中,具有很好的分类性能。SVM通过选择不同的核函数和参数可以使其具有不同的分类
数字水印技术是一种新型的信息隐藏技术,它的主要思想是在数字视频、音频和图像媒体中加入保护数字产品的版权证明。它弥补了密码技术和数字签名技术的缺陷,因此,数字水印技术作
随着Internet的迅猛发展,WWW已经发展成为包含多种信息资源、站点遍布全球的巨大的动态信息服务网站,为用户提供了一个极具价值的信息源。而传统的信息检索技术由于对这些信
随着Internet的飞速发展,网络迅速成为一种重要的信息传播和交换的手段,在Web上出现了丰富的数据资源。为了更有效的利用这些数据,需要在一个统一的平台上对这些数据进行集成和
自然现象的建模和渲染是近十几年来计算机虚拟现实与系统仿真的一个重要研究领域,而基于物理模型的流体模拟近年来成为这个领域的一个研究热点。由于在现实世界中运动规律的复