数据挖掘交互式过程可视化的研究与应用

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:mj5211314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息处理技术的发展,数据挖掘引起了普遍的关注,其主要原因是存在大量数据可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。但是由于数据挖掘结果的难以理解性,需借助可视化数据挖掘的理念和技术,帮助用户更紧密地与整个挖掘过程相结合,提高整个数据挖掘过程的灵活性、有效性和与用户的交互性。本文总结了数据挖掘与可视化关键技术、研究现状和应用前景,重点对数据挖掘中决策树可视化模型进行了分析。在以往的数据挖掘模型中可视化技术的应用十分有限,所以用户无法了解挖掘过程,更不能指导挖掘过程,也不能很好地理解挖掘结果。文中分析了经典的决策树ID3算法,对其原理进行了深入剖析。由于ID3算法偏向于属性取值较多的属性,但属性取值多的属性并不一定是重要的属性。提出了一个算法,将多类问题转换成两类问题。阐明其原理,使用同一组数据对两种算法的实验结果进行了分析比较,证明了算法的可行性。设计并实现了一个决策树可视化系统,以C++Builder为开发平台,将可视化部分组件加入系统中,实现了数据可视化、交互挖掘、模型可视化以及评估等功能。为避免挖掘的盲目性,系统中根据信息熵原理对决策的依据属性进行简化,去除对目标不重要的属性,并且通过可视化方式展示属性的预测强弱关系。决策树可视化部分主要包括叶子节点可视化和树可视化。用户如果对挖掘的结果不满意,可以重新选择属性来构造模型;如果满意,将决策树转换成决策规则。最后用测试数据对模型进行评估。该系统建立的可视化模型能够为用户提供更直观、易于理解和分析的界面,提供更好的交互功能,方便用户指导挖掘过程。
其他文献
随着虚拟现实技术的发展,面对越来越复杂的场景模型和有限的图形绘制处理能力,为了提高实时绘制速度,满足交互式应用需求,研究人员探究出一些在图像真实度和帧速率之间折衷的方法
作为一个广泛分布的全球信息服务中心,万维网集中了海量的信息,其中大多数是以网页文本的形式存放的。这些文本信息种类繁杂,缺乏组织,现有的以搜索引擎为代表的网络信息系统
指导教师签字:随着全球信息化时代的到来,由于数字媒体所具有的易传播、易复制等特征,使得知识产权得不到有效的保护,这将严重影响该领域的健康发展。因此,版权保护是一个迫切需要
随着很多基于位置服务的兴起,位置预测发展成了一项必要的任务,比如,通过预测用户的目的地,向用户推荐旅游景点的信息,或者发布一些超市、商场的折扣信息等。位置预测就是根
近年来,随着定位技术以及基于位置应用的不断普及,应用提供商和研究机构积累了大量的用户轨迹数据,用于研究、分析和发布。其中,轨迹数据的发布是以发掘轨迹数据学术价值和商
随着各行业对计算能力及计算速度要求的增加,并行计算成为当今计算机科学中一个重要的研究领域。并行程序开发过程本身固有的复杂性、可靠性、可移植性等问题制约着并行程序
平台技术有效屏蔽了底层操作系统及编程语言的复杂性,大大减轻了技术上的负担。然而,开发人员仍然需要了解具体平台的编程模型和编程接口,在编码实现时,这些平台相关的细节常常和
随着数据库技术的发展、网络技术的迅猛普及和计算机硬件的不断出新,使人们采集数据的能力得到了极大的提高,积累了海量的数据。这些数据中蕴涵了大量有价值的知识、模式、规律
在银行系统,如中国建设银行,自动指纹识别系统作为一种业务辅助系统和安全内控机制得到了普及并发挥了很好的作用。尽管自动指纹识别的算法研究和开发应用取得了很大进展,但是在
协议是网络的血液和生命,计算机网络的发展是网络协议设计和开发的结果。随着通信网络向着高速度、高性能、多媒体等方向的发展,协议变得越来越复杂,通信协议的设计已经成为通信