多标签图像数据的特征选择问题

来源 :温州大学 | 被引量 : 0次 | 上传用户:lvxinjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,人们采集信息的能力越来越强,由此积累了越来越多的高维数据,例如Facebook,Label-me,Flicker以及腾讯空间等网站产生的图像数据就是其中比较常见的一种。出于对图像数据管理的需要,对图像内容的自动化理解成为了一项重要的研究课题。本课题的研究主要涉及图像标签的预测问题,具体地来说就是图像表示特征的优化选择,从而提高已有预测算法精度的研究。特征选择是指按照一定的标准从特征空间中选出最佳的特征子集的过程,目的就是为了保留对分类有价值的具有代表性的特征,按照分类贡献大小选择出最具有代表性的若干特征构成特征子集来表示全部特征,从而达到降低特征空间的维数和数据缩减的目的,提高模式识别算法在标签预测、图像识别问题上的性能。目前,针对高维图像数据的特征选择问题的研究工作还比较少。问题主要体现在图像特征的维数过高,传统方法计算量大,存储消耗高,无法顺利进行。为了解决这一问题,本课题基于特征相似性分组的方法,避免了对高维特征作为一个整体直接进行特征选择,而是通过在组内进行特征评分,然后将每个特征在多个组内的评分进行有机整合,得到每个特征在所有特征中的评分值,实现鲁棒特征选择。通过在国际上标准的图像多标签预测数据集Core15K、EPSGame、IAPRTC12上进行了充分的实验,证明了本论文所提出算法的有效性。
其他文献