可视化数据挖掘工具的设计与实现

被引量 : 0次 | 上传用户:sophia115416
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
硬件技术的发展使得目前的计算机系统能存储大量的数据。每年要产生大约1,000,000TB的数据,其中绝大多数是数字形式。数据通常通过传感器、监控器记录。每天的一个简单事务,如信用卡支付、电话使用,都被计算机系统记录下来。由于常常记录了许多参数,导致了高密度的多维数据产生。所有涉及到的区域的数据都被采集,这是因为这些数据是潜在、有价值信息的源泉,而有价值信息可以提供一个竞争优势。然而找出隐藏在这些数据背后的有用信息是很困难的。依靠目前的数据库管理系统,人们只能看到数据的小部分。如果数据以文本方式表达,显示的数据将包含大约100个数据维,但当我们处理的数据集包含数百万数据维时这只是大海中的一滴。由于没有可能充分探索采集的海量数据,数据逐渐变得无用,而且数据库渐渐变成数据垃圾场。要让数据挖掘产生效果,很重要的事情就是要把人类包含在数据探索过程中以及把人类的灵活性、创造性、人类总的智慧与目前计算机的巨大存储能力、强大的计算能力结合起来。可视化数据挖掘的目的就是让人类参与数据挖掘过程,让人类洞察目前计算机系统上的大量数据集。可视化数据挖掘的基本思想就是用一些可视化技术形式表达数据,使得人类可以洞察数据、得出结论、直接与数据进行交互。已经证明,可视化数据挖掘技术在数据分析和探索大型数据库有很高的价值。可视化数据挖掘技术尤其在对数据了解甚少、探索目标模糊的情况下特别有用。 论文首先介绍了可视化数据挖掘工具的研究背景、现状、意义、来源、目标和论文工作,可视化数据挖掘领域内国内外已有的文献综述;接下来,论文介绍了数据挖掘和可视化数据挖掘的基本概念、技术与方法;然后介绍了可视化数据挖掘系统的原型结构,在此基础上设计出可视化数据挖掘系统(VDMTOOLS)的架构,进而给出了系统的JAVA实现,并对系统进行了仿真测试和分析。最后,总结了已经完成的工作,对仍然需要解决的问题提出解决方案,提出今后的可行的研发设想。
其他文献
网络技术、流媒体技术的飞速发展,使传统面对面教学正在向引进校外优质教育资源开展异步非实时混合教学再到同步实时在线教学转变。中外合作混合教学将混合教学与同步实时在
世界政治格局伴随着前苏联的解体而发生巨变,出现了权利真空。从此美国人认为可以根据美国的民主模式和价值观去改造世界,这是新帝国主义思潮的抬头。在经受“9·11”事件“
H5亚型高致病性禽流感(HPAI)是由H5亚型禽流感病毒(AIV)中的一些毒株引起的禽类高度致死性传染病,并威胁着人类的健康,被国际兽医局(OIE)列为A类疾病,在我国被列为一类动物传
重型工程运输车属于重型工程机械,广泛应用于船舶建造、路桥建设等领域,是大型物件搬运过程中必不可少的专用设备。它采用全液压驱动,并配有现代的微电控制系统,是一种“机、
我国奶牛乳房炎的发病率很高,造成的损失很大,应用抗生素治疗一方面很难取得满意效果,另一方面造成牛乳中药物的残留。由于微生态制剂具有功能多、无毒副作用、不残留等优点,
随着信息化的飞速发展,局域网成了企事业单位内部交流的一个必备平台,使得一些黑客有机可乘,利用相关技术和手段盗取网内的私人信息或机密文件,给人们带来了巨大的损失。该文
当前的传统音乐出版物因无法适应民众生活化、娱乐化的审美倾向而无法有效发挥其文化传承作用。只有破除传统音乐出版的体制束缚,推进其市场化、产业化和数字化进程,才能使其
大型模锻液压机是生产大型铝镁合金以及钛和钛合金模锻件的重要设备。在国防和航空工业的大型模锻件生产中有着不可替代的作用。大型模锻液压机的制造受到零件制坯、零部件加
高中阶段学生的学习任务是非常繁忙的,很多高校都会为学生取消体育课,音乐课等课程。让学生有更多的时间去复习主要学科,在高考当中取得良好的考试成绩,考入理想的大学。而高