粗糙集与支持向量机结合的方法在连续属性离散化中的应用

来源 :东北大学 | 被引量 : 0次 | 上传用户:w11122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集和支持向量机都是为了从数据中提取固定模式而提出的数据挖掘方法。粗糙集理论适用于海量数据,支持向量机是在统计学习理论基础上提出的分类方法,它的结构风险最小化准则和核函数理论,避免了“维数灾难”和“过学习”等传统方法的缺点。本文将粗糙集和支持向量机相结合,利用两种方法的优越性,提出了一种先用粗糙集进行预处理,再用支持向量机精确分类的方法。本文首先介绍了粗糙集和支持向量机的基本理论,对粗糙集的下近似、上近似、决策规则以及支持向量机的结构风险最小化原则、核函数等理论做了简要的回顾,分析了两种方法在数据挖掘领域的优势和局限性。然后,针对以往连续属性离散化方法分类规则复杂、会丢失大量信息的问题,提出了基于粗糙集下近似理论的离散化方法。这种方法可以对海量数据进行预处理,将根据粗糙集理论肯定属于某一类别的样本提出,并删除样本数据中可能的噪音数据,得到部分决策规则。这种方法不会破坏原数据集的不可分辨关系,而且得到的分类规则简洁。接着,利用支持向量机方法只与支持向量有关的特点和能够精确分类的优势,将经过粗糙集预处理的数据用支持向量机方法精确分类。最后,仿真实验表明,该方法在缩短训练时间的基础上,保留了支持向量机方法所需的分类信息,去除了样本数据中的噪音数据,提高了分类精度,克服了SVM算法的应用瓶颈。
其他文献
1990年,日本著名拓扑学家K.Chiba证明了在λ-仿紧条件下正规、集体正规等拓扑空间的逆极限运算是保持不变的.最近十多年来,我国拓扑学者熊朝晖、蒋继光等在正规σ集体正规、δ-
本文讨论如下四阶半线性发展方程ut+△2u=|u|p,(x,t)∈Ω×(0,t]的初边值问题,其中Ω包含于R2为有界区域。初始条件为u(x,0)=u0(x),x∈Ω。  对于边界条件,我们分别考虑下面
差分方程的振动性研究是差分方程定性理论研究的一个重要组成部分.在实际生活中,如生物数学、经济学等学科中提出的模型大量的应用了差分方程作为数学模型来描述. 本文分
本文主要运用微分不等式的技巧(或称为上下解方法),在一定条件下证明几类非线性微分方程边值问题(不带小参数)解的存在性(部分内容包括解的唯一性),并在此基础上研究带有小参数