论文部分内容阅读
随着信息技术及互联网技术的飞速发展,网络信息成为一种人们熟知的便捷信息来源和休闲生活方式,但网络上大量的色情淫秽等不良信息已经严重干扰了正常的网络生活,严重毒害着青少年的身心健康,网络空间的色情传播已在全球引起了关注,如何净化网络环境,增加对网络活动的监控手段,提高信息识别的能力便成为一种强烈的需求,作为其技术支持,基于内容的不良信息识别技术日益引起人们的重视。基于内容的不良图像的识别和检测技术近来已引起人们的极大兴趣,同时它也是基于内容的网络过滤系统所面临的一个重要且亟待解决的研究课题。色情图像的识别问题实际上是一个图像分类问题,我们使用基于内容的方法对图像进行研究,采用统计分类方法实现对色情图像的识别,采用的关键技术有:肤色检测、目标区域的提取、图像特征的提取、分类器的设计。肤色检测在基于内容的不良图像信息识别研究中具有重要地位,是统计分类方法中特征提取的基础。通过对肤色特征、肤色检测过程中颜色空间的选择、多种肤色模型的比较进行研究后,我们综合利用YUV和YIQ颜色空间进行肤色检测,并在此结果的基础上使用基于直方图的大津法从检出区域再次甄别肤色区域,从而得到满意的肤色检测结果。实验表明,使用这种方法能够有效地检测出图像的皮肤区域。根据误检为肤色区域以及皮肤区域本身的特点,本文使用纹理分析的方法来消除误检的皮肤区域。特征提取是统计分类方法的基础,选择合适的特征也是实现对不良图像的识别的关键,我们对图像上主要的特征提取方法进行了描述,包括颜色特征、纹理特征、边界形状特征、区域形状特征等。通过利用前面提到的肤色检测方法,我们可以得到一个肤色目标区域,如果没有得到目标区域,则我们就可以认为该图片是正常的,否则我们对肤色区域提取肤色的颜色特征;由于目标区域的形状可以通过其质心的不同圆周上的分布来描述,因此我们提出了一种基于分布的形状特征描述子,在该目标区域内进行不良图像区域特征的提取;同时结合傅里叶变换提取不良图像区域的低频图像特征,也就是我们所说的纹理特征,从而更有利于不良图像的识别。分类器设计是统计分类方法的关键。不良图像识别问题是一个小样本问题,支持向量机具有极好的学习性能,对解决小样本、非线性和高维模式分类问题具有很大优势。我们首先对SVM的原理进行了介绍,明确了特征向量的构造方法:我们把得到的形状特征向量、颜色分布特征向量和纹理特征向量组合到一起就可以形成一个具有205个元素的特征向量。然后对核函数的选择与训练方法、基于SVM的不良图像识别算法的基本框架进行了描述。通过实验,我们提供的这种基于内容的不良图像识别方案的查全率为82.67%,达到了比较好的效果,达到了我们预期的研究目标,该课题的研究可以为打击色情图像的传播提供技术支持。