论文部分内容阅读
随着科学技术的不断发展,因特网成为主要的信息来源之一。在因特网广泛使用的同时,大量的色情图像也被非法的传播。如何防止网络黄毒侵害是个重要的研究课题,已经吸引了国内外众多学者从事这方面的研究,出现了两类不同的解决方案:一类采用网址封锁和关键字过滤,另一类采用基于内容的图像过滤技术。采用网址封锁的方法具有明显的滞后性,不能适应Internet的迅速发展和动态变化。另外敏感词汇匹配很容易屏蔽正常网页,因此必须引入计算机视觉技术对嵌在主页中的图片进行分析才能有效的打击网络黄毒的传播。本文以此为背景,对基于内容的黄色图像识别的若干关键技术进行了研究。由于图像中的人物可以是多种肤色多种姿态的,而且图像背景千变万化,所以基于内容的黄色图像识别是相当困难的问题。本文重点不在于研究分类器的结构和黄色图像的详细特征,而是从人类的视觉系统原理出发,创新性的提出了一种新颖的黄色图像识别方案。本文的主要研究工作如下:首先搜集构造了一套较为完整的实验图库,其中包括黄色图像库、正常人物图像库和正常非人物图像库,并采用分级思想对图像库中图像进行细分标识,为论文后续研究作基础。结合矢量量化的思想,我们提出了一种基于内容的快速图像检索算法。其思想是提取图像特征,构造一个多维的特征矢量,然后结合矢量量化中的码书搜索算法,提出基于均值不等式最近邻图像检索(Equal-average Nearest Neighbor Image Retrieval,ENNIR)和基于均值不等式前k个最近邻图像检索(Equal-average k Nearest Neighbor Image Retrieval,EKNNIR)两种快速检索算法,根据这两种快速算法,利用特征矢量对图像进行快速检索。该快速检索算法使检索结果得到了很好的改善。然后分析了目前常用的检测模型,肤色检测从整体上可以分为两个研究方向:一种基于单个像素进行判断,另一种结合考虑区域像素之间的相互关系。本文比较了若干肤色检测算法,综合检测精度和检测速度两方面因素,最终选定基于色度空间模型的算法实现黄色图像的肤色检测。最后结合快速的图像检索算法和肤色检测算法,提出了一种新颖的黄色图像识别方案。首先运用快速检索算法计算待检图像与正常人物图像的相似度,然后分析该图像的肤色特征,进一步识别该图像是否含有黄色内容。通过实验证明该方案能够正确并快速的识别黄色图像,具有较高的实用性和研究价值。本方案还有很多地方需要改进和完善的地方,比如更加高效的肤色检测模型的确立和基于人体局部敏感部位特征的检测识别等,这些都需要后续研究改进。