基于核心示例集的属性约简方法研究

来源 :河北科技大学 | 被引量 : 0次 | 上传用户:mbx1998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的发展和数据库管理系统的应用,海量信息以不同数据形式被存储起来。数据挖掘就是为了获取这些数据中有价值的信息而发展起来的一种数据处理技术。数据的属性并不是同等重要的,甚至某些属性是冗余的。因而,精炼数据库的属性集(属性约简)成为数据挖掘技术的一个重要环节。本文通过规则知识的形式化描述,提出了确定性知识与核心示例集的概念,结合决策树算法提出了基于核心示例集的决策树属性约简方法,主要工作如下:(1)本文对决策树算法的本质特点进行了研究,在将规则知识形式化的基础上,提出了确定性知识与核心示例集的概念,并证明了规则知识不变性;(2)结合决策树算法,以核心示例集的不变性为理论基础,提出了决策树的属性约简方法与核属性求解方法;(3)在非协调环境下,揭示了决策树通过强制拟合使节点纯度不为1,在确定性知识与核心示例集的概念的基础上提出了β-确定性知识和β-核心示例集,并依此建立了基于β-核心示例集的决策树属性约简方法。结合具体实例,分析了这些方法的特征与性能,结果表明,它们都具有较强的可操作性,可以有效地处理不同类型数据库的约简问题。
其他文献
为调查重性精神障碍患者陪护家属的心理健康状况,采用自编问卷和症状自评量表(SCL-90)进行调查,对数据进行统计分析,结果发现重性精神疾病住院患者陪护家属的年龄、文化程度、与
智能车是当前的一个研究热点,许多汽车厂商与IT行业重资投入并取得了一定的进展,但其理论与技术是保密的,因此对智能车的理论与技术研究仍具有重要意义。由于路况的复杂性,实现完
可修排队系统考虑了服务设备会发生故障这一实际情况,即服务台可能发生故障且可修复的排队系统。研究可修排队系统要从排队指标和可靠性指标两方面进行。本文研究成批到达的M
微分方程是以方程描述未知的函数与其导数之间关系的一种形式。微分方程在数学及其应用中的意义在于:许多实际中的物理与技术问题的研究,都可以归结为微分方程的求解问题。微分
本文在有界区域上研究广义Kawahara方程的初边值问题,运用压缩映射原理得到局部解,结合能量积分方法、不等式技巧和嵌入定理建立解的先验估计证明了在有界区域上整体正则解的存
系统发生学是分子进化生物学的一个重要研究领域,涉及生物信息学、数学、生物统计学以及计算机等学科.近年来,基于系统发生学的计算分子进化发展迅速,在进化遗传学、生态学以及