基于数据仓库的可视化数据挖掘系统的设计与实现

被引量 : 0次 | 上传用户:yeyeh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的广泛应用,各个行业积累的数据越来越多,人们希望能够在对已有的大量数据分析的基础上进行科学研究、商业决策或者企业管理,但是目前所拥有的数据分析工具很难对数据进行深层次的处理,难以得到感兴趣的知识,形成数据丰富而知识缺乏的局面,数据挖掘正是为了解决传统分析方法的不足,并针对大规模数据的分析处理而出现的。目前,学术界提出了很多数据挖掘算法,许多IT公司也推出了自己的数据挖掘产品。但是以上产品存在主动性差、智能性较低、系统集成困难和结果难以理解等缺陷,文中给出了一个基于数据挖掘的可视化系统,分析了该系统的系统架构和模型的可扩展性,力图弥补现有数据挖掘系统存在的缺陷,减少用户对系统的依赖性。该系统由数据预处理、数据可视化、模型可视化和挖掘算法子系统组成,给出了各部件的功能和结构,并讨论了系统的组织、算法的实现等关键技术问题。主要内容如下:第一章介绍了数据挖掘技术的背景,意义和研究现状。第二章介绍了与数据挖掘相关的数据仓库,ETL等技术和数据挖掘的流程。第三章设计和实现了应用于移动领域的可视化数据挖掘的系统,学习和研究了数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等;根据挖掘方法的不同可分为:机器学习方法、统计方法、神经网络方法和数据库方法等。最后实现了分类算法,聚类算法,应用模板设计模式,方便了系统将来的扩展。第四章介绍了数据可视化和模型可视化,使得不具有专业背景的数据挖掘技术的人使用数据挖掘来进行商业决策成为可能。最后对论文的工作进行总结并提出以后进一步的研究方向。
其他文献
随着这两年微信的普及,我国微信用户基数群已经超过了五亿人,人们的沟通交流方式都发生了前所未有的改变,同问题,本文对微商所存在的问题进行探讨,为微商后续发展提供思路。
Mg基非晶合金因具有低密度、较高的比强度和比刚度等优异性能而越来越受到人们的关注。但纯Mg基非晶合金塑性较差,因此本文制备出一种综合性能优异的Ti/Mg基非晶双连续相复合
板料成形是重要金属成形工艺之一,在航空航天、航海、汽车及轮船制造业中有着广泛应用,是现代制造业中重要组成部分。不锈钢蒸发板的胀形过程是一个高度非线性的大变形过程,如果
本文是建设部软科学研究项目——“低密度住宅的存在形式与发展依据”的一个组成部分,从城市土地方面进行城市低密度住宅宏观角度的背景研究。以对城市土地的研究为切入点,借
等距型面无键联接的应力集中不显著,装拆方便,传递扭矩大,能够实现自动对中,以间隙配合装配,以过盈配合工作,具有较高的应用价值。但因等距型面加工工艺复杂,制约了等距型面无键联接
长期以来,职业中学语文教学由于种种原因,重读写而轻口语交际。但是,在现代社会,正如戴尔·卡耐基所说:“一个人事业上的成功只有百分之十五是由于他的专业技术,百分之八十五则要靠
<正>02当回顾每个年度令人印象深刻的基金公司时,往往都会出现一位代表性基金经理或者一组极具特色的主动管理投研团队。公募基金市场发展到第20个年头,绝大部分基金公司已经
心脏病是严重威胁人类健康和生命的主要疾病之一。由于心脏病发作带有很大的偶然性和突发性,实时心电监护可以及时获取患者的心电信息,以便及时发现异常情况,采取相应的处理
目的:探讨针刺联合药物治疗经行头痛的临床疗效。方法:2008年1月~2010年3月本院确诊的经行头痛72例患者,均采用药物结合针刺治疗3个疗程,随访6个月。结果:治疗后总有效率为98.61%
随着信息技术的发展和市场竞争的加剧,我国各型企业纷纷组建管理信息系统。本文对某数控设备厂建立管理信息系统进行了研究和探讨,其目的是通过对设备进行信息化管理,实现网络数