论文部分内容阅读
信息技术的发展尤其是互联网技术的飞速发展给人们的工作生产生活带来了极大的便利,网络信息成为一种人们熟知的便捷信息来源和休闲生活方式,但网络上大量的色情淫秽等不良信息已经严重干扰了正常的网络生活,严重毒害着青少年的身心健康。网络空间的色情传播已在全球引起了关注,如何净化网络环境,增加对网络活动的监控手段,提高信息识别的能力便成为一种强烈的需求,作为其技术支持,基于内容的不良信息识别技术日益引起人们的重视。
基于内容的不良图像的识别和检测技术近年来已引起人们的极大兴趣,同时它也是基于内容的网络过滤系统所面临的一个重要且亟待解决的研究课题。色情图像的识别问题实际上是图像分类问题,我们使用基于内容的方法对图像进行研究,利用统计分类方法实现对色情图像的识别。采用的关键技术有:肤色检测、图像特征的提取和分类器的设计。
肤色检测在基于内容的不良图像信息识别研究中具有重要地位,是统计分类方法中特征提取的基础。通过对肤色特征、肤色检测过程中颜色空间的选择、多种肤色模型的进行比较后,我们综合一种被称为脉冲耦合神经网络的方法,结合YIQ颜色空间进行肤色检测。20世纪90年代,研究者基于哺乳动物视觉皮层神经活动提出了脉冲耦合神经网络(Pulse Coupled Neural Network—PCNN)模型。因为PCNN具有生物视觉的现实依据,所以在图像处理存在着优势,许多的研究者把脉冲耦合神经网络应用于图像分割,图像滤波,图像编码等方面,人们已经做了大量的研究工作。对于把脉冲耦合神经网络应用于图像的分割,已经取得了很大的成绩,但是把神经网络应用于人体肤色检测,这方面的研究还较少。传统的肤色检测多是基于像素点的检测,这种检测方法没有考虑肤色像素之间关系的特性,本文中,结合着区域增长的思想,研究了把PCNN用于人体肤色检测的相关技术,这种肤色检测技术是基于区域的检测,它结合了肤色像素之间的相互关系信息,实验表明,它能够有效地检测出图像的皮肤区域。
分类器设计是统计分类方法的关键。不良图像识别问题是一个小样本问题,AdaBoost分类器具有极好的学习性能,它的基本思想就是按照所给出的具有自适应性的阈值条件训练出一定数量的弱分类器,再将这些弱分类器级联成强分类器用于目标检测。我们首先对AdaBoost的原理进行了介绍,明确了特征的选择,以及简化计算等方法。通过对测试图像集中目标区域的标注,计算出敏感区域的harr特征,采用积分图的方法进行简化,降低了计算的复杂度。接着从敏感区域的大量的harr特征中,选择描述目标区域最有力的特征,用这些特征构成弱分类器,在此基础上,把这些弱分类器相互级联,构成强分类器,来完成对敏感图像的检测。简言之,利用AdaBoost可以分为三步:训练样本的准备,分类器的训练和目标区域的检测。通过实验,我们提出的这种基于内容的不良图像识别方案的,达到了很好的效果。