【摘 要】
:
支持向量机方法已成为数据挖掘中不可缺少的一项技术,它成为近年来数据挖掘技术的新热点。现有的支持向量机大多速度较慢,无法适应实际应用。2005年Tsang提出的核心向量机(Co
论文部分内容阅读
支持向量机方法已成为数据挖掘中不可缺少的一项技术,它成为近年来数据挖掘技术的新热点。现有的支持向量机大多速度较慢,无法适应实际应用。2005年Tsang提出的核心向量机(Core Vector Machine)算法,其最显著的特点是对支持向量机中最花费存储空间和训练时间的二次规划问题(Quadratic programming,QP)进行改进,使用最小闭包球(Minimum Enclosing Ball,MEB)来解决,从而缩短了求解二次规划问题的时间。本文在使用核心向量机(Core Vector Machine, CVM)来解决入侵检测和航班延误预警这两个实际应用过程中,对核心向量机做如下改进:针对入侵检测中样本数据集过于庞大,学习速度过慢且未充分利用先验知识等问题,提出了基于中心约束最小闭包球的加权二类算法,即首先利用先验知识确定一种新的基于相对紧密度的方法计算样本权值并将其融合到二类支持向量机中,然后转化为中心约束的最小闭包球进行训练。实验结果表明,该方法比现有的支持向量机具有更合理的分类面并且训练速度得到明显提高。目前支持向量机分类问题,大多只针对两类问题进行处理而不能满足实际应用的需要,提出了基于中心约束最小闭包球的加权多类算法。该方法比多类核心向量机有更高的精度,比支持向量机有更快的训练速度。针对排列问题,提出了基于最小闭包球的排列算法,即首先给出了基于最大化间隔原则的排列算法的原始表达形式,然后归结为最小闭包球问题。经理论分析,该算法的时间复杂度与样本集大小成线性关系,空间复杂度与样本大小无关,而且比支持向量机的排列算法有更快的训练速度。
其他文献
随着计算机技术的日益成熟,硬件成本的迅速降低,各种结构复杂、功能强大的计算机系统被广泛应用到航空航天、交通运输、核电能源和医疗卫生等安全关键领域。一旦这些系统失效,将
本体——共享概念的明确的形式化规范说明,近年来受到信息科学领域学者的普遍亲睐,被广泛应用于知识工程、信息处理、自然语言理解及语义Web中。本体可以实现知识的共享和重
随着农业信息技术的快速发展,农业数据在快速积累和增加,对农业数据进行分类的需求也越来越多。如何将这些农业数据快速有效地转化为有价值的信息,是当前信息计算机技术领域
数据挖掘,也称为数据库中的知识发现,是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程,是数据库技术、人工智能、机器学习、统计分析、模糊逻辑、模
入侵检测技术作为一种保护方法对计算机网络安全起着重要的作用,将数据挖掘技术引入到入侵检测中,能够增强入侵检测系统对海量数据的处理能力,并使得入侵检测系统具有可扩展
作物生长模型是精准农业、数字农业和智能农业的重要支撑,近年来模型研究呈现出内容细致化、目标多样化和应用具体化等发展趋势。基于小样本数据的作物生长模型具有低耗、灵
开关磁阻电机调速系统(Switched Reluctance Drive,SRD)是集现代电力电子技术和控制技术为一体的典型的机电一体化系统,具有结构简单、坚固、成本低、工作可靠、控制灵活、运行效率高、适合于高速与恶劣环境下运行等优点。但是由于SRM电机本身是一个多可控量、强耦合的非线性系统,所以需要研究其控制方法,从而得到较好的调速性能。论文的主要工作如下:1、对开关磁阻电机调速系统(SRD)在
Ad hoc网络是一种工作在无固定结构环境下的自组织的无线移动网络。它适用于军事或是一些特殊应用场合,例如,战场上部队快速展开和推进、发生地震或水灾后的营救等。在没有网
随着信息化程度的不断提高,数据中心发生灾难而造成的数据丢失,会给企业造成巨大的损失,因此构建容灾系统对企业变得越来越重要。调查表明:总体拥有成本(TCO)过高是很多企业
动态二进制翻译器采用运行时翻译的方法来动态生成可执行代码,而传统调试器只能被用来调试静态生成的代码,所以传统调试器无法被用来调试运行在动态二进制翻译平台之上的可执