连续属性离散化相关论文
本文讨论数量关联规则挖掘过程中连续属性离散化问题,结合k度完全的思想合并和分裂传统的最近邻聚类算法的结果来离散化连续型属性......
本文提出了一种基于类别驱动的,有监督的、静态的、全局的、领域独立的连续属性离散化方法.能保证在离散化区间数尽量小的同时,获......
目前我国水资源承载力的研究主要集中在我国北方和西北干旱半干旱地区,而对于水资源相对较丰富的西南地区很少.相对丰水区的水资源......
粗糙集理论是一种新型的处理模糊和不确定知识的数学工具,但粗糙集理论只适于处理离散数据,连续属性离散化问题是粗糙集理论研究的一......
数据库知识发现(KDD)是涉及人工智能和数据库等学科的一门当前相当活跃的研究领域.在当今数字化社会中,各种商业、政府、科学数据......
数据挖掘是当今数据库和人工智能最活跃的研究领域之一,是知识发现(Knowledge Discovery in Databases,KDD)的核心,它的目的在于发......
该文主要研究KDD的一个重要发现任务--数量相联规则提取,KDD的一种数据预处理技术--连接属性离散化,以及相联规则的试验初步--人工......
该文对神经网络规则抽取和连续属性离散化领域的现状进行了深入分析,在此基础上,从功能性的角度出发提出了-神经网络规则抽取算法S......
信息时代的来临,带来大量的数据。这些数据中隐藏着许多重要的信息和知识。如何从表面数据中提取到深层次的、表现了事物内在规律......
随着数据库和网络技术的不断发展进步,我们生产和搜集数据的能力有了大幅度的提高,数据量成指数级的增长,面对庞大的数据量,数据挖......
连续属性离散化是数据挖掘和机器学习研究及应用中的一个重要方面。在很多规则提取、特征分类算法中,连续(实值)属性必须进行离散......
我国的公安机关在多年的工作中,一方面不断推进信息化的建设,另一方面,其在公安工作的专门数据和社会信息方面都有了相当大规模的......
文章提出一种基于粗糙集理论的主轴轴承组件故障识别方法,针对具有连续属性的实验数据,将等间距聚类法引入连续属性离散化,通过应......
本文给出了新的可辨布尔矩阵的定义,建立逻辑关系方程解模型,利用布尔矩阵的初等行变换把系数矩阵化为最简矩阵,并根据系数矩阵和......
将数据挖掘应用于建筑能耗基准评价上,提出建筑能耗基准评价过程模型,给出具体的基准评价的方法。 对上述过程模型的最重要两步—......
研究了连续属性空间离散化问题 ,将信息熵函数与无穷范数的概念应用到连续属性离散化问题 ,提出了基于信息熵的属性空间极小化算法......
基于信息熵的有关理论 ,提出了一种新的连续属性的自动聚类算法。首先介绍了 Shannon熵的概念及其两个重要的定理 ,基于信息的不确......
提出了一种新的连续信息系统的知识获取方法.首先给出了连续属性离散化方法,该方法可以使得离散化后得到的分类的类数适度,丢失的......
本文探讨了基于属性重要性、基于信息熵、基于遗传算法和基于聚类的离散化算法,通过分析总结了各算法的优点及不足,并提出有待解决......
传统的粗糙集理论只能对数据库中的离散属性进行处理,所以对存在连续属性的数据库必须进行离散化处理。连续属性离散化是机器学习......
目前很多离散化方法仅考虑单个变量,不能得到最优的离散化方案.文中提出一种多属性关系的数据离散化方法.凭借概率的模型选择和最......
计算机技术的迅猛发展和数据库系统的普遍使用,给人们提供了强有力的平台,去更好地利用信息技术进行生产,而且搜集和检索数据的能......
目前,数据采掘已经成为人工智能、数据库等领域的研究热点,关联规则采掘是数据采掘中最活跃的研究内容之一.该文对关联规则采掘技......
为在应用粗糙集理论处理数据时,对连续属性进行离散化预处理,采用k均值算法对连续属性进行离散化的方法,将属性无监督聚类成两类.......
朴素贝叶斯分类方法是简单的贝叶斯分类方法,在众多分类方法和理论中,朴素贝叶斯由于计算高效、精确度高,并具有坚实的理论基础而得到......
【目的】解决传统分类存在硬性划分和部分分类方法只能处理离散型数据的问题。【方法】利用模糊综合评价方法实现对具有连续属性样......
针对连续属性离散化过程中由于区间分割不当所造成的病态问题,提出一种最优离散化方法.将离散化中的分割点划分问题转化为一个指标......
提出了一种基于类-属性关系依赖度的数据离散化方法,其特点是:借助统计学的λ相关系数,有效地捕获类-属性间的相互依赖,以此来选取......
提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通......
介绍了在数据库知识发现(KDD)中将连续属性离散化的一些方法,并提出使用值差分度量离散化的算法,值差分度量算法原本是用于计算离散属......
连续属性离散化方法对后续阶段的机器学习和数据挖掘过程有着重要的意义。提出一种新的针对决策表的离散化算法,在该算法中,首先将信......
为了剔除样本信息中存在的冗余成分和不相容性,同时提取关键信息等,根据样本信息的特点和信息具有粒度的思想,基于粗糙集的2个近似......
研究了基于联合熵和粗糙集理论的关联规则挖掘算法,改进了基于粗糙集的属性离散化方法—连续属性联合熵差离散化算法;以联合信息熵......
连续属性离散化在机器学习和数据挖掘领域中有着重要的作用。连续属性离散化方法是否合理决定着对信息的表达和提取的准确性。Chi2......
对基于信息论的离散化系列算法进行了分析,在此基础上提出了一种新的连续属性离散化方法。该算法使用信息偏差来对断点重要性进行......
提出一种基于改进粒子群优化的连续属性离散化算法。在算法优化方面,采用改进粒子群优化算法。为了克服传统粒子群优化的不足,对种......
为了解决数据挖掘和机器学习领域中连续属性离散化问题,提出一种改进的自适应离散粒子群优化算法。将连续属性的断点集合作为离散粒......
为了弥补粗糙集理论不能直接处理连续数据的不足,提出了一种基于粗糙集和布尔逻辑连续属性离散化的改进方法,针对相同个数的断点情......
目的:结合面向医学领域的数据挖掘技术,对乳腺肿瘤诊断方法进行优化。方法:提出连续特征离散化的New-Chi2算法,通过均匀选取类样本的......
研究了数量关联规则挖掘过程中的连续属性离散化问题,描述了连续属性离散化方法,包括连续属性区间划分算法和数据库样本大小的确定......
粗糙集理论是一种新的处理不精确、不完全与不相容知识的数学工具.粗糙集理论只能对离散属性进行处理,而不能处理连续属性.文中针......
连续属性离散化在机器学习和数据挖掘领域中有着重要的作用.连续属性离散化方法是否合理决定着对信息的表达和提取的准确性.Chi2算......