产生式/判别式混合分类方法研究

来源 :山西财经大学 | 被引量 : 0次 | 上传用户:ssqq56
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘分类技术中的统计模型被分为产生式和判别式两大类,这两类模型是近几年数据挖掘和机器学习的研究热点之一。产生式模型学习的是联合概率,主要侧重各类数据的分布情况;判别式模型学习的是条件概率,主要侧重各类数据的分类边界。两类方法侧重点不同,表现出的分类性能也不同。为了充分利用两种分类器各自的优势,扬长避短,越来越多的学者们开始研究产生式和判别式的混合分类模型,解决单类分类器不能解决、难以解决或者难以有效解决的分类问题。本文首先介绍了三个典型的混合模型框架,分析了这几个框架下,研究人员已提出的产生式/判别式混合模型的具体形式及存在的问题。然后系统地论述了产生式模型和判别式模型的概念、学习方法、统计特性,并对产生式和判别式模型进行了详细的比较,分析了它们各自的适用领域。在此基础上,提出了两种有效的产生式/判别式混合分类器:(1)鉴于AdaBoost集成的思想,提出了基于AdaBoost的产生式与判别式混合分类算法。该算法在AdaBoost集成方法的每一轮中同时学习两个分类器:一个产生式分类器和一个判别式分类器,选择误差率较小的作为该轮中的个体分类器,然后对所有个体分类器采用加权的方法得到最终分类器。实验结果表明,该方法在准确率和收敛速度上都有明显的提高。(2)以符号回归的思想为基础,提出了基于遗传规划的产生式/判别式混合分类方法。该方法将产生式和判别式模型混合的表达式学习看作符号回归问题,利用遗传规划学习产生式和判别式的混合表达式。该方法是一种一般性方法,不仅避免了求取产生式和判别式部分的权重的问题,而且产生式和判别式混合的数学形式是根据数据集特征的变化而变化的,更具有适应性。实验结果证明,该混合模型要优于单个的产生式模型和单个的判别式模型,在一定程度上提高了分类的准确率。
其他文献
入侵检测系统是继数据加密、访问控制和防火墙等传统安全保护措施之后的新一代安全保障技术,作为一种积极主动的动态防护技术已成为近年来的研究热点。入侵检测系统在计算机
人类的动作识别作为行为理解的一个方面,逐渐成为计算机视觉研究中一个比较热点的课题之一。同时由于动作识别的复杂性,因此对其的研究还尚在起步阶段。目前已有的一些方法主
随着社会的发展,越来越多的嵌入式电子产品进入人们的生活。对于开发人员来说,在嵌入式系统开发的整个周期,图形界面的开发越来越重要。随着现代电子设备功能的增多和操作方
Symbian作为一种智能手机平台目前得到广泛应用。Symbian编程具有多任务和内存保护的特性。软件的重构和进化是当前软件工程中的重要内容。本文研究了在Symbian编程环境中应
随着传感器技术、微系统技术、无线通信技术以及计算机技术的蓬勃发展,具有现代意义的无线传感网络技术20世纪90年代末首次在美国出现。无线传感网络提供一种新的信息获取模
随着嵌入式技术和计算机网络的飞速发展,人们的生活水平不断提高,人们对家居环境的舒适、便捷及效率要求也越来越高。为了满足人们生活日益发展的需要,智能家居逐渐发展起来
随着互联网技术的迅速发展和普及,各高校、企事业单位以及政府部门都已经拥有自己的门户网站,并逐步开始将其下属的院系、部门网站纳入其主页中,希望实现集群化管理。然而,这些网
学位
外包数据库模式下,文档数据存放在不可信远程数据库服务器端,由于文档数据的敏感性,需要对明文文档数据加密,但加密后的数据失去了明文所具有的特征,不能像操作明文文档数据
当前Web 2.0应用日趋成熟,许多在线社交网站,例如网络论坛、个人博客、问答社区等流行起来,并受大众的热捧。其中,网络论坛作为社交网络中的一种开放互动式平台,成为新闻信息
学位