论文部分内容阅读
随着计算机技术特别是数据库技术的迅猛发展,以及人类活动范围的扩展、生活节奏的加快,人们能以更快速更容易更廉价的方式获取和存储数据,这就使得数据及其信息量以指数方式增长。面对这些极度膨胀的数据,人们受到“信息爆炸”和“数据过剩”(Data Glut)的巨大压力。这些海量数据如果不能有效利用起来,将只会成为“数据垃圾”。对人类社会进步起到巨大作用的是知识。 数据挖掘就是从大量数据中发现潜在规律、提取有用知识的方法和技术。数据挖掘包含的内容很多,其中很重要的一个方面是分类规则挖掘。分类规则可以根据训练数据,利用适当的算法训练出分类器,从而对新的未知样本做出预测。支持向量机是基于统计学习理论的一种新的分类方法。同其它分类器相比,支持向量机具有很好的推广性能,对未知样本的预测有较高的准确率,因此得到广泛应用。 本文首先将可拓学基元理论应用与对象之间的空间关系。将支持向量机理论应用于对空间数据进行分类,简单的支持向量机只能处理二值分类问题,本文在己有多分类支持向量机基础上,将支持向量机基理论与传统的二叉树分类方法结合,提出了基于距的二叉树多类SVM算法,并且通过实验验证了算法的有效性。