基于知识粗糙度和拓展属性约简的若干智能挖掘算法的研究

来源 :福州大学 | 被引量 : 1次 | 上传用户:Ryan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是研究不完整、不确定问题的一种有效的方法,它具有不需要先验知识,忠实于原始数据的优点。在数据挖掘与数据库知识发现领域,粗糙集理论与方法已经得到了大量成功的应用,并已经成为数据挖掘与数据库知识发现的主流方法之一。 经典的粗糙集的方法针对的是确定性的信息系统,很多算法也是基于这样的假设。但是在实际的应用中,由于种种原因,我们得到的数据都带有一定的不完备性和不确定性,对于这样的问题,经典的粗糙集学习算法便显得捉襟见肘。于是很多扩展的粗糙集模型便应运而生,如变精度的粗糙集模型、模糊粗糙集模型等等,它们将近似、概率统计的观点引入经典的粗糙集中,定义了新的属性约简、核以及相应的可辨识矩阵,并在一些应用中取得了可喜的成果。 本文先是介绍了一种基于知识粗糙度的多变量决策树的构建算法,它在一些情况下得到的决策树比ID3得到的简单。进一步,本文分析了不一致信息系统下的分布约简、最大分布约简和熵意义下约简的性质和它们之间的关系,得出了熵意义下约简与分布约简等价的结论。同时借助概率统计中的卡方分布,提出了一种衡量属性约简与决策属性的相关性的随机性强弱的方法,为从多个属性约简中选择较好的约简提供了一种参考的原则。 在某些应用的场合下,样本数据是不断的增加或者被修改的,这就要求当有新样本到来的时候,学习算法可以在原来的获得的知识的基础上,增量地学习,而非一概地重新运行挖掘算法。为此,本文基于最大分布约简的可辨识矩阵,提出了一种增量的学习算法,并将其应用于医疗数据的挖掘中,试验的结果说明了算法的正确性和有效性。
其他文献
当前,电子商务不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入地了解客户需求信息和购物行为特征的可能性。新型的数据贮存和处理技术 — 数据仓库能
数控技术在如今高新技术飞速发展的今天已经悄然演变成了最核心的技术,为了提高本国的制造水平和科技竞争力西方各个发达国家均大力发展数控技术,将其作为加速经济发展、提高
  本文在室内3-D环境中建立“基于镜像原理的射线跟踪算法”的分块模型,并进行了深入研究。建立了基于“镜像原理的3-D射线跟踪算法”的分块模型,考虑了有损介质的反射、透射
随着信息技术的不断进步,社会上的各行各业都在充分利用计算机应用系统的功能来帮助处理日常事务,提高工作效率。本文针对当前各大高校数字化校园的发展现状,以及在这个发展过程
现实世界中随机性与模糊性无处不在,无论在日常生活中还是在工程技术、生命科学、经济管理等领域。模糊集理论作为经典集合论的推广,可以用来表示人类知识中大量存在的模糊性概
Internet电话系统中的业务创建和配置比传统电话系统要复杂,业务种类的定制和增加也更为快捷和灵活。因此,在业务不断增加的过程中,业务冲突与业务发展之间的矛盾日益突出,并
随着网络信息的高速增长,为了解决信息过载和信息迷航所带来的种种问题,个性化服务已经成为信息领域研究的热点之一。个性化服务针对不同的用户采取不同的服务策略,提供不同
  本文论述了课堂教学评价的数学模型。  首先,提出用试卷评价方法进行课堂教学评价指标体系的合理性进行分析,提出指标达标的难度、区分度、效度和信度。指标体系评价结果
脉冲耦合神经网络是新一代人工神经网络,具有较好的鲁棒性和自适应能力。本文应用PCNN模型,将神经元与图像像素一一对应,根据织物疵点区域纹理与正常织物纹理的灰度强度和分布差
数据挖掘面临着许多问题的挑战.其中,数据挖掘的个人隐私与信息安全问题尤其得到关注.如何在不暴露用户敏感信息的前提下进行数据挖掘,一直是人们感兴趣的课题.问题的解决对