基于粗糙集理论的高效数据挖掘算法研究

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:wyy_9715072
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近年来数据库领域中出现的一个新兴研究热点,也是提高管理决策支持能力的一种重要手段和工具。它的任务是从大量数据中提取隐含的、未知的、对决策有潜在价值的知识。 粗糙集理论在1982年由波兰科学家Z.Pawlak首次提出以来,经过二十多年的研究和发展,已经在理论上和实际应用中取得了长足的发展。粗糙集方法是一种处理不确定或模糊知识的重要工具,近年日益受到国际学术界的重视,已经在模式识别、机器学习、决策支持、过程控制等许多领域取得成功的应用。本文主要研究基于粗糙集属性约简的数据挖掘系统,文中对粗糙集理论进行研究,并分析了基于粗糙集理论的数据挖掘算法。 属性约简是粗糙集理论研究的主要内容之一。本文综合已有属性约简算法改进了一种基于熵的属性约简算法,并用产生的规则对对象进行分类。通过应用实例表明,该方法是可行的。 基于粗糙集理论的数据挖掘研究正处于起步阶段,数据挖掘本身及粗糙集理论研究还有许多问题值得探讨,论文将二者结合研究肯定还有很多不完善的地方,相关工作还有待于进一步的研究。
其他文献
医院数字化是信息化浪潮的必然趋势,当前,医院数字化过程中面临着一些急待解决的难题:信息系统集成度不高、信息的利用率不高、标准化较差等。PACS(Picture Archiving and Co
随着嵌入式技术、通信技术的迅猛发展和人们安全意识的日渐提高,利用嵌入式系统及其他外围芯片实现报警系统已成为可能,而且是一种发展趋势.本课题是利用当今世界最先进的卫
随着网络和电子商务的发展,网上传播的数字内容存在着大量的盗版和侵权问题,因此对网上交易的数字内容进行版权保护,成为一个迫切需要解决的问题。但现在的数字版权保护技术
该文提出一种可适用于高维数据空间的相似度和密度的度量方法(实际上它可以适用于任何维度的数据).与传统的直接采用两个数据对象之间的距离(或其它系数)来定义其相似度的做
当今,随着Internet的快速发展,web技术凭借其实时的信息发布、动态的用户交互以及与后台系统灵活的安全连接等优点得到了广泛应用。与此同时,面向web应用程序开发的技术也得到了
近年来认知心理学和神经生物学的研究表明,人类在识别物体所属的具体类别之前,可以对其进行快速的理解。同时,选择性注意理论也表明视觉系统主要负责处理图像中的部分重要细节,而
网格技术将所有可用于共享的资源(例如,计算机、高性能设备、S贵仪器、存储设备、科学数据、软件、数据库等)通过网络连接起來,并将它们转化成一种随处可得的、可靠的、标准
随着各种网络应用不断涌现,在采用网络应用较多的企业中,出现了安全管理的问题。尤其是当这些应用采用不同的权限分配和控制方式时,整体的安全策略难以制定,各个子系统的管理变得
随着Internet的飞速发展,互联网所面对的和隐藏的安全威胁越来越复杂,越来越严重。作为网络安全的一个重要组件,入侵检测系统将发挥着越来越重要的作用。但是现有的大多数入
函数发现是指从大量看似无规则的数据中挖掘出函数关系并用于进行预测。函数发现属于数据挖掘中知识发现的一个分支,随着数据挖掘的兴起而兴起,不过此方向的研究进展较慢,最初人