论文部分内容阅读
随着Web技术的普及和信息技术的发展,以图像、声音和视频为主的多媒体信息迅速成为信息传播和交流的主流方式。大量图像视频信息存入大规模图像数据库中,使得图像数据库变得庞大、复杂。如何根据图像的语义和视觉特征从中选取所需的图像是当前面临的一个迫切问题。而传统的基于关键字的信息查询方法远远不能满足现代图像信息的检索。传统数据库技术面临着组织、表达、存储、管理、查询和检索这些图像数据信息的挑战。因此,结合图像处理技术、模式识别技术、计算机视觉检测技术和数据库技术以建立高效的图像检索机制和开发性能良好的检索工具就成为目前迫切需要解决的问题。而基于内容的图像检索技术就成为了解决这一问题的关键。基于内容的目标检测一直是模式识别领域的一个研究热点,它不仅具有良好的理论研究意义,也在医疗、交通、侦查等诸多领域有着广泛的应用前景。随着研究的不断深入和识别技术的发展,基于目标检测的一些技术已经逐渐成熟并出现了一些实际应用,如:医学图像检索系统、商标检索系统、人脸检测和识别、文字/手写体识别、指纹检测、智能交通系统等。针对AdaBoost级联算法随着学习难度的增加容易造成过度拟合而导致分类器的分类效率下降、稳定性变差的问题,以及支持向量机面对大规模样本时训练时间较长的问题,发挥支持向量机在小样本、非线性、高维度的模式识别中表现出了其特有的优势,本文改进标准AdaBoost级联分类器的训练算法,提出了AdaBoost-SVM级联分类算法。算法开始时为AdaBoost级联分类器的每一级设置弱分类器的最大个数,当某一级的弱分类器数达最大个数而分类器却没有达到误报率目标时,SVM分类器将取代AdaBoost分类器进行分类,此时SVM分类器只需对AdaBoost分类器已选择的特征进行训练,SVM的训练时间就可以大大地减少。因此,AdaBoost-SVM级联分类算法不仅可以得到较高的分类准确率以及较低的误报率,还可以保证训练速度和检测速度。实验中选取两种不同类型的图像分别进行人脸识别和行人检测实验,选择固定的窗口大小将输入图分割成不同区域,利用Haar-like矩形特征加积分图方法进行特征提取,然后利用AdaBoost-SVM级联分类器进行分类训练。实验结果表明,AdaBoost-SVM级联分类器的分类器准确率和误报率优于AdaBoost级联分类器,训练时间要远远小于SVM分类器。