论文部分内容阅读
多示例学习被认为是继监督学习,无监督学习和强化学习之后的第四类机器学习方法,它的出现为机器学习注入了新的活力,在图像处理、股票市场分析等领域有着广泛的应用前景。本文对多示例学习的基本理论和算法展开研究,并将其应用于图像分析中的目标识别和跟踪领域,主要内容如下:1、从两个方面总结了多示例学习研究成果;一是多示例学习算法的研究成果,多示例学习最先是从麝香分子的分类问题中被提出,在此之后,多示例学习受到机器学习界的广泛关注,学者们纷纷研究新的算法以解决多示例学习问题,本文重点介绍了DD算法及其重要意义。二是多示例学习应用的研究成果,多示例学习被广泛应用在股票推荐、文本分类、图像检索等众多领域。2、针对传统机器学习在字符识别应用中存在样本获取困难等问题,提出基于Mean Shift+支持向量机(Support Vector Machine,简称SVM)的多示例学习方法。该方法首先将包含字符的图片作为一个包,提取图片的局部特征作为包中示例;然后使用改进的Mean Shift算法来自适应挖掘出表征包的概念标记的示例,去除包中其他干扰示例;最后对精简后的包使用SVM算法进行学习,在此基础上构建多示例多值SVM分类器,实现对字符的识别。3、针对复杂环境下传统在线学习的目标跟踪方法,容易出现跟踪漂移问题,提出基于改进随机森林的在线多示例(MIRT)目标跟踪方法。该方法构建了一个能够区分背景和目标的多示例学习分类器,以目标周围一定区域的若干图像子块作为正包中的示例,使得分类器具有更好的容错性。并改进随机森林学习方法,使之可以处理多示例学习问题,对所获得的正包与负包进行在线学习,有效应对目标外形,光线和背景变化。