论文部分内容阅读
高光谱遥感图像已在军事侦察、地图绘制、环境监测、地理信息系统、精准农业等实际任务中发挥越来越重要的作用。这些实际任务的实现涉及目标检测、地物分类等关键技术环节。其中精确的高光谱目标表述是实现这些关键技术的基础核心问题。常见高光谱目标表述方法表述能力有限,近年来更多的研究将目光转向机器学习领域。在众多的机器学习方法中,多示例学习方法由于具备不需要精确像素级语义标签的优点,成为训练样本受限时高光谱目标表述的有效方法。在面向实际高光谱目标表述任务的多示例学习方法中,可能存在正样本数量较少的问题,通常表现为两种情况:一是正包内目标示例远少于背景示例,导致示例级数据不均衡问题;二是提取的正包数远小于负包数,导致包级数据不均衡问题。这些都会导致学习到的目标表述性能不佳。此外,由于高光谱图像数据量大,冗余多,使目标表述存在“维数灾难”问题,导致训练过程被冗余信息干扰,影响目标表述的性能。因此本文针对多示例高光谱目标表述方法,以高光谱目标检测为应用对象,重点研究高光谱目标表述的多示例学习中存在的示例级和包级数据不均衡问题,以及高光谱目标表述的多示例学习与降维方法,。首先,针对示例级数据不均衡问题,提出示例级均衡数据多示例高光谱目标表述方法。通过提取每个包中最可能为目标的示例组成正示例集,并以此正示例集为基础合成新的正样本,增加正样本在正包中所占比例,改善高光谱目标表述能力。在合成和真实高光谱数据上验证了所提方法的有效性,实验结果表明所提方法使正包样本组成更均衡,从而学习到更优的目标表述,提高了高光谱目标检测的性能。其次,针对包级数据不均衡问题,提出包级均衡数据多示例高光谱目标表述方法。通过提取每个包中最可能为目标和最可能为背景的样本组成相应的正负示例集,合成新的正负样本并加入到事先准备好的带有正标签的空包中,即合成新正包。通过增加正包在训练集中所占比例,使数据样本得到均衡,进而改善高光谱目标表述能力。在真实高光谱数据上验证了所提方法的有效性,实验结果表明所提方法使测试集中正负包数量更均衡,从而学习到更优的目标表述,进而显著提升高光谱目标检测的性能。最后,针对高光谱数据冗余导致的高光谱目标表述学习的“维数灾难”问题,提出基于PCA降维的多示例高光谱目标表述学习方法。通过为提取的正包和负包进行示例级的PCA降维,将高维度数据通过正交变换转换到合适的低维度,去除冗余信息对多示例高光谱目标表述学习过程的干扰,改善高光谱目标表述能力。在真实高光谱数据上验证所提方法的有效性,实验结果表明提出的方法使目标表述以及目标检测的性能明显提高。