超图学习理论研究及其在SAR溢油检测上的应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:jianqing3232
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于超图的半监督学习因其既利用了有标记数据样本的信息又利用了无标记数据样本的信息,近年成为一个研究热点,有很高的研究及应用价值,在图像处理、模式识别、语音识别等领域已经得到广泛的应用。然而超图学习仍然面临许多复杂的问题,其中有数据样本间多重相关性问题、训练数据分布不平衡问题和误标记样本问题。另外,在基于合成孔径雷达(Synthetic Aperture Radio,SAR)图像海面溢油检测应用中,除了存在这些问题外,还存在标记样本少的问题。本文围绕这些复杂分类问题,主要在以下几个方面展开了深入的研究:  (1)针对样本间多重相关性问题,本文先后提出三种方法考虑样本间的相关性。第一种是在构建超边集时,增加给定半径的超球面内样本构成的一类超边,与采用最近邻算法选取的邻域构成的一类超边合成为新的超边集,然后构建超图学习模型,在多极化SAR图像数据分类学习上获得了很好的效果;第二种是结合稀疏表示构建一个稀疏超图,与传统超图线性结合成为一类新的超图学习模型,应用于图像分类学习中分类性能有较大的提升;第三种是考虑到超图学习中只有类别属性相关的表示,而没有类属无关的表示,利用成对约束理论既表现样本间的相关,也能表现类属无关,以此进一步强调标记样本的相关性,因而在超图学习模型中加入成对约束的思想,该方案在标准数据集上实验效果较好。相比于传统超图学习,这三种方法都有一定的成效,在学习性能上有不同程度的提升。  (2)针对不平衡分类问题,本文通过研究大量的不平衡处理算法,提出代价敏感的超图学习算法,定义类别重要性因子既表示一类样本的重要性,也表示错分该类样本的代价,还定义加权精度作为不平衡分类学习的性能评价指标,为多类不平衡分类评价提供了一种非常简单的评价指标。  (3)针对误标记样本问题,本文研究了目前检测误标记样本的算法,并提出一种基于超图学习的误标记样本检测方法。该方法先确定误标记嫌疑样本集与核心样本集,然后计算可疑标记样本在核心样本集上的均方残差确定误标记样本与次误标记样本集,最后以核心样本集为训练集,其他样本作为未标记样本集进行超图学习,进一步提炼误标记样本与次误标记样本集。对于误标记样本,在后续的操作中抛弃,而对于次误标记样本,减少其类属信念,达到减少对分类学习性能影响的目的,在标准数据集上实验验证了该方法的有效性,为其他研究误标记检测的学者提供了一种新的思路。  (4)在基于SAR的海面溢油检测应用中,训练集同样存在上述的误标记与不平衡问题,还存在标记样本量少的问题,为此本文通过研究目前溢油检测的方法分别提出了相应的解决方案。针对油斑与非油斑数据样本数量不平衡的问题,本文提出两种思路,一种是采用基于马氏距离的代价敏感处理算法,另一种是代价敏感的超图学习方法,两种思路都表现出了一定优势,而后者又正好适合训练样本量少的分类情况。本文设计代价敏感的多模型超图学习算法,解决油斑训练集不平衡与样本量少的问题,相比于其他传统的溢油检测方法,实验效果得到明显提升。  本文在超图学习模型上考虑样本优化问题,分别提出相应的解决方案,一定程度上改善了超图学习的性能,并且应用到基于SAR的海面溢油检测中,也取得令人满意的效果。
其他文献
随着社会数字化程度的的提高以及网络技术的迅猛发展,各种多媒体产品,如音频、图像、视频等层出不穷,极大的满足了人们的娱乐、沟通的需求。但是,由于网络的开放性、数字产品
现实中的许多应用,如社交网络、P2P信贷、生物信息、社交投资等许多数据库系统都是构成异构信息网络。因此,针对异构信息网络的数据挖掘任务是当前热门的且充满挑战的研究新方
语义Web作为目前Web的一个延伸,目标是使Web上的数据具有机器可识别的语义,便于人机之间的交互与合作。然而其实现面临着语义互联、规范组织和智能聚合等理论和技术障碍。为
随着经济全球化的发展,企业的采购、生产和销售日趋国际化。市场竞争日益加剧,越来越多的企业意识到传统的生产管理模式与多变的市场不相适应,于是企业开始寻求适合自身发展的新
面向运动目标的视觉分析是计算机视觉领域最活跃的研究主题之一,在高级人机交互、安全监控、视频会议、医疗诊断及基于内容的图像存储与检索等方面具有广泛的应用前景。运动
文本聚类是聚类分析领域的一个重要研究分支,是聚类方法在文本处理领域的应用。针对大规模高维的文本数据,如何实施有效的文本聚类算法是数据挖掘领域的研究热点。文本数据的
校园网作为学校重要的基础设施,担当着学校教学、科研、管理和对外交流等许多角色,能够安全有效的对教育网络带宽进行调度和分配,满足教育网络多媒体教学和远程教学、图书馆
学位
与平面显示技术相比,立体显示技术可以提供更全面的场景信息,为观众带来逼真的现场感,是人类一直以来对自然视觉重现的追求。以往立体显示技术需要借助各种辅助工具进行观看,
随着信息技术的发展,作为信息技术的基础,软件正在随着其规模的扩大和复杂性的提高,变得越来越难以开发和维护。互联网技术的发展更使得软件漏洞暴露在大量的攻击和入侵事件
随着现代计算机网络技术的发展,诸如银行系统、火车票网上订票系统、卫星控制系统等分布式系统得到广泛的开发和使用。针对大规模分布式系统以及安全至上的系统,容错能力是其设