半监督组合分类算法研究与应用

来源 :中山大学 | 被引量 : 0次 | 上传用户:dandanCracker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的分类问题通过对大量有标记的训练样本进行学习,从而建立用于预测无类别标签的样本的模型。但在许多实际的分类问题中,如图像分析、网页分类、疾病检测、信用评级等,所得到的带类别标签的样本数量往往较少,而获取类别标签的成本很高;但是不带类别标签的数据样本往往很多,获取这些样本的代价也相对较小。近年来,如何利用大量无类别标签样本来改善分类器性能的半监督学习算法得到了广泛的关注和研究。 另一方面,传统的分类算法通常生成单一的分类器。但是由于现实数据分布的复杂性,单一分类器往往在精度和泛化能力表现的不好。组合分类算法组合多个单一分类器的结果形成最终的预测,为许多分类问题提供了更准确、更具泛化能力的方法。 但是,组合分类算法的研究一直关注于全类别标签的分类问题,对于半监督学习问题,常见的组合分类算法在精度和稳定性方面受到挑战。为此,结合国内外使用组合分类方法解决半监督学习问题的研究成果,本文提出了一种基于空间分布的结构发现的协同组合分类算法。实验证明该算法具有较好的精度和鲁棒性,在具有较少有类别标签样本的任务中依然保持较高的准确度和稳定性。
其他文献
缓存技术已经在计算机领域得到了广泛的应用,对硬件和软件性能的改善都起到了举足轻重的作用。同样在WEB领域,无论是在服务器端,还是在客户端,缓存技术都已经有了广泛的应用。由
税控收款机作为税收电子化的“咽喉要道”,是最重要的税收工具,它的推广和应用关系到国计民生,对于帮助国家税收征收和稽查具有决定性的意义。我们研发的税控收款机在满足国标要求的前提下,采用“S3C44BOX CPU+μClinux"的方式来实现主要外设功能,降低了系统成本,具有较高的性价比和竞争优势。本文首先研究了国内外税控收款机发展状况,指出目前市场上流行的税控收款机的不足,结合我国税控收款机的国家标
基于OGSA体系结构的网格本质上是面向服务的网格结构,服务网格的提出为网格技术的发展提供了一种新思路,使用Web Service的技术标准实现网格内部以及网格之间的异构协作。但是W
随着多媒体技术和网络组播技术的飞速发展,越来越多的内容提供商选择组播网络作为多媒体内容的发布平台。而在组播环境下的数字产品的版权保护问题也变得越来越尖锐。组播指纹
线性辨别分析算法在目标识别、图像降维和特征抽取上已经得到了广泛的应用。近些年来,国内外的许多学者将特征抽取和模式识别的研究重点放在了流形学习领域,希望通过在目标空间
对等网络(P2P,peer-to-peer)因其独特优势逐渐成为Internet中最重要的应用系统之一,但其开放、匿名、以及节点之间松耦合的特性使得节点可以恣意散布非法内容,滥用网络资源,
由Kobliz和Miller提出的椭圆曲线密码学是密码学中一个具有重要意义的研究课题。椭圆曲线上的双线性对在椭圆曲线密码中起着重要意义。一方面,椭圆曲线上的双线性对被用来攻击
D.F.Specht提出的概率神经网络(Probabilistic Neural Network, PNN)是基于贝叶斯决策理论与Parzen窗概率密度估计方法而建立的一种分类网络。PNN的训练过程简单,算法容易设
随着网络带宽的不断提升,单台服务器远远不能达到高性能、高可用性、高伸缩性的性能标准,因此,利用负载均衡技术使多台服务器协调工作、为用户提供一个良好的高效的网络环境成为
随着计算机与网络技术的普及和推广,工作流技术的研究与开发成为了一个新的热潮。但是,由于工作流是新兴领域,现有的工作流的技术研究还不够成熟,所以工作流安全方面的研究,