基于后验概率和流形正则化的半监督分类方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:sunplusit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于流形正则化的半监督分类算法框架(Manifold Regularization,MR)和基于后验概率的支持向量机(Posterior Probability Support Vector Machine,PPSVM)是近年来提出的两种比较新的分类方法。然而,MR在标记样本位于模糊异常区域时容易发生分类偏差,而PPSVM则对标记样本数目要求高。为解决这些问题,将后验概率知识引入到MR框架中,设计一种基于后验概率和流形正则化的半监督分类算法框架PPMR。PPMR采用流形正则化技术,在再生核希尔伯特空间中求解一个分类函数,使得标记样本在此分类函数上输出的后验概率值尽量与标记值接近,而距离很近的样本(包括标记样本和未标记样本)在此分类函数上输出的后验概率值也尽量接近。其基本思想是区别对待每个标记样本,采用后验概率知识指示标记样本的位置,并利用未标记样本传播这种后验概率知识。这校正了模糊标记样本引起的分类偏差,又发挥了未标记样本的分类的作用。在MR的基础上,直接采用后验概率标注样本类别值得到PPMR的基本形式;根据经验规模调整正则化系数后得到PPMR的改进形式;在此基础上,引入后验概率映射函数,采用映射值标注样本类别值,得到PPMR的推广形式。分别采用平方损失和关键损失定义抽象损失函数得到基于PPMR的两种基本算法。为进一步阐明PPMR框架并验证PPMR框架的有效性,在仿真数据集、公共标准数据集以及医学实际应用数据集上进行多次随机重复实验,探讨不同的核函数、后验概率映射函数等因素对于PPMR分类效果的影响,并比较PPMR框架与MR框架和PPSVM算法的分类性能。结果表明,PPMR框架在一般情况下具有更好的分类精度和稳定性,特别是在模糊异常标记样本情况下,PPMR框架一般都具有更大的优势。
其他文献
LZ77算法,又被称为“滑动窗口压缩”,它依赖两个滑动窗口来进行压缩,一个窗口包含已输入数据流,称为字典窗口DW(dictionary window);另一个窗口包含待压缩编码的字符串,即待编码窗
仿射算术作为一种可靠的数值计算模型,已经广泛应用于计算机图形学和计算机辅助几何设计中。例如,隐式曲面的绘制和参数曲面求交问题,都可以利用仿射算术予以解决。然而,串行
随着伺服控制技术的发展,伺服双轴同步运动在多个领域有越来越广泛的应用。同时伴随着数字信号处理器的性能发展,推动伺服控制往高精度、高智能化和全数字化方向发展,对伺服双轴
随着在线视频行业的发展,视频行业的广告收入也一直保持着良好的增长势头。目前在线视频广告系统由于广告投放内容随机导致广告与视频内容的相关性较差、广告投放时机固定导致
随着互联网飞速的发展,网络信息量不断增加,为提高实时检索的效率,需要一种快速的索引方法。就搜索引擎而言,对大规模文本构建索引涉及较大的数据量和计算量,会消耗大量计算资源,如
随着云计算技术的飞速发展,很多互联网服务商都推出了自己的云平台。云平台中的基础设施满足用户的虚拟机使用请求,对虚拟机分配资源并进行调度。现有云平台中的虚拟机调度模块
随着嵌入式系统应用的日益广泛,嵌入式应用系统所包含的功能也越来越多,且嵌入式应用系统的更新换代的周期越来越短。这导致了嵌入式应用系统巨大的设计与开发压力,要求进行软、
互联网将各种信息提供给人们的同时,海量的信息又使人们很难迅速而准确地获取自己最需要的信息。这是因为计算机不能理解目前网页内容的语义且各种信息缺乏组织。语义网技术通
织物图像的风格是指一种固有的模式,这种模式不仅包括了织物中的图案而且也包括了它们各自的空间关系。每种风格的图案都有各自的独特性。基于风格语义的织物图像分类非常有
分割是计算机视觉的基本研究问题,也是近几年来比较热的研究方向之一。分割是指从图像或视频序列中提取出感兴趣的前景物体。随着计算机视觉的发展,涌现了大量的图像和视频分割