面向人口收入管理的数据挖掘研究与应用

来源 :青岛理工大学 | 被引量 : 0次 | 上传用户:venus1231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国信息化产业的繁荣发展,数据挖掘作为一门新兴的交叉学科在各行业的广泛应用引起了信息产业界的极大关注,同时,这门技术具备的强大数据分析优势对传统的数据管理模式产生了较大冲击。而数据挖掘算法分析是贯穿于整个数据挖掘过程的一个重要环节,对算法的研究和改进是不断提高数据挖掘效率的有效途径。因此,构建一个高效的数据挖掘算法,与开发相应的应用管理系统,将能大大改善目前传统数据管理系统所处的瓶颈现状。本文对数据挖掘技术的相关基本概念进行了介绍,从分析Apriori算法和K-Means算法原理入手,探索经典的数据挖掘算法存在的不足,并对其进行优化和改进。算法研究的重点之一是针对Apriori算法在候选集产生过程中存在的不足提出了一种优化有效候选集产生的MA-Apriori算法,该算法在原有传统Apriori算法基础上,改进了数据集的存储方式,增加了候选集产生的判断条件,提高了原算法频繁项集生成的准确性;对K-Means算法的改进是算法研究的另一重点,针对K-Means算法初始聚类中心点随机选取的不确定性,提出了一种改进的IM-K-Means算法,该算法在原K-Means算法基础上调整了初始聚类中心点的选取方法,缩短了寻找最优聚类中心点的时间,提高了算法效率。其次,利用SPSS Clementine数据挖掘软件搭建关联、聚类、分类和预测四种建模过程,该软件采用了CRISP-DM标准,实现对原始数据隐藏信息较为全面的挖掘和结果分析说明,将所得建模结果作为后续人口收入管理系统运行结果的参考依据。最后,根据传统数据管理系统的特点结合数据挖掘技术的优势,从系统需求分析到功能设计并考虑到了改进后MA-Apriori算法和IM-K-Means算法的应用,开发出了一套基于人口收入数据的数据挖掘应用系统,该系统在基本数据管理功能上增加了关联功能和聚类功能并附带了分类预测功能,实现了对原始数据的深入挖掘,完善了传统数据管理系统的功能。
其他文献
车载无线自组织网络(Vehicular Ad Hoc Networks,VANET)是一种应用于交通领域,网络环境动态变化的无线自组织网络(Ad Hoc Network)。由于VANET网络具有节点移动速度快、网络
火灾是当今社会人类面临的主要灾害之一,火灾的发生严重影响社会经济发展,破坏自然生态,也会给人类的生命和财产带来损失,因此早期火灾探测意义重大。但是传统的针对烟雾、热
无线传感器网络综合传感器技术、嵌入式计算技术、微电子技术和无线通信技术等多个学科,具有易部署、可扩展、高可靠等特点,是一种新兴的交叉研究领域。它在军事国防、环境监控
智能视频监控技术是计算机视觉领域中一个重要的研究方向,具有广泛的应用。智能视频监控技术中的重要组成部分是对运动目标进行检测和跟踪,尤其是人体目标的检测和跟踪是很实
LTE-Advanced是长期演进(LTE)技术的进一步增强,旨在保证LTE及后续技术的长久生命力,同时以满足IMT-A和未来通信的更高需求。3GPP也将利用LTE向LTE-Advanced的平滑演进,进一步巩
VoIP即基于IP协议的网络电话,是三网融合产品必不可少的功能,是光接入终端产品的主要功能之一。VoIP在硬件上主要依靠CPU、DSP和SLIC三种芯片协同工作;在软件层面又分为信令协
盲道检测是导盲设备的关键技术,对于提高盲道的使用率具有重要的意义。近年来,国内外研究人员提出了多种盲道分割算法,但是在面对城市中各种类型的盲道和复杂场景时,现有的分
目前,盲人群体的出行具有极大的不便,盲道作为辅助盲人出行的重要设施,其作用并未得到充分的发挥。因此,如何有效的利用盲道信息以方便盲人出行便成为了学者们研究的重点。盲
随着科技的发展,IP技术和移动通信技术也在不断地融合。作为融合的关键技术之—,移动IPv6切换技术成为当前互联网和通信领域的研究热点。在移动IPv6中,由于切换而导致的通信
PON(Passive Optical Network:无源光纤网络)技术是通信技术界的一场技术革命,突出优点是消除了户外的有源设备,所有的信号处理功能均在交换机和用户宅内设备完成,从而使得维