基于IE浏览器的色情图片过滤器的设计和实现

来源 :吉林大学 | 被引量 : 0次 | 上传用户:b110701007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网已成为学习知识及开阔视野的最佳途径,它正在逐渐发展成为大众伸手可及的媒体传播手段和通讯工具;然而互联网也带来诸如色情小说、色情图像传播的问题。一些预防网络色情的软件相继被推出。但是,所有这些软件包中的算法不是基于IP地址的过滤,就是基于网页中文本内容的判断。前者是通过IP地址的匹配屏蔽相应信息,需要定期地将收集到的IP地址更新到IP地址库中,具有明显的滞后性;后者由于文本内容的局限性会造成某些相关站点被漏过,许多有益站点被屏蔽,准确性不高。只有针对图像内容的分析与理解才能从根本上解决目前网络安全技术对图像信息过滤与监控能力不足的问题。本过滤器就运用了基于内容的图像过滤技术(CBIF—Content-Based Image Filtering),采用肤色检测并辅助以纹理处理。色情图像的过滤可以看作是一个图像理解与识别问题,但是它与一般的人脸识别和指纹识别有所不同,主要是由于图像的背景条件比较复杂、光照条件不一致、人体的表现形式具有多姿态性,因此很难用一个简单的模型把所有的特征表征出来。根据色情图像本身的特点——有裸露肌肤,我们利用肤色检测模型与纹理模型相结合,并且采用相应的分类算法来建立过滤器模型。彩色信息常常作为一种有效的特征,在图像分割中得到应用。在不同的光照条件下,虽然物体颜色的亮度会产生很大的差异,但是它的色度具有恒常性,基本保持不变。肤色大致上分为黄色、棕色、黑色和白色等,它们在颜色空间都对应着一定的分布区域,形成特定的模式。YUV和YIQ是在图像处理研究领域经常用到的两种颜色空间。色度空间模型是采用YUV和YIQ两种颜色空间在肤色方面的特性来进行肤色检测的。YUV颜色模型中,Y表示亮度,U和V为色度信号。色度信号是一个二维矢量,称之为色度信号矢量。每一种颜色对应一个色度信号矢量,它的饱和度用模值Ch表示,色调由相位角θ表示。以相位角θ为特征进行图像分割可以去掉与肤色在色调上有较大区别的背景,但该肤色模型难以把肤色与棕色头发或<WP=77>灰色背景分开。由于人脸肤色包含了较多的黄色分量,我们可以在YIQ空间利用彩色的饱和度信息来增强分割效果。I分量代表了从桔黄到蓝绿的色调,值越小,含的黄色越多,蓝绿色越小。采用YUV空间的相位角θ和YIQ空间的I分量作为特征,能够确定肤色的色度信息分布范围。统计发现肤色色调范围具有规范性,的变化范围基本在[100,150],I分量范围为[20,90]。采用肤色模型检测待过滤图像,得到初步的掩码图像;但是由于其它非肌肤物体颜色与肌肤颜色相似,可能造成误检,误差较大;因此需要在上一步的基础上采用纹理模型来处理得到的掩码图像,把那些非皮肤的肤色区域去掉,这样就可以更准确的识别出色情图像中的肤色区域,提高正检率,降低误检率。所有视觉表面都具有纹理特征,它包含物体结构及其与周围环境的关系等重要信息。纹理模型需要对皮肤像素的纹理特征进行分析,找到其共同性;把经肤色检测后得到的误检区域去掉,正检区域保留。灰度统计的方法是图像处理中的基本方法,在实现中使用了一阶灰度统计的思想来判断图像中某点及其周围部分是否具有皮肤区域的光滑特性。首先得到区域的统计灰度值,一般为平均值或区域中心的像素灰度值;然后区域中的像素值与统计值比较产生特征从而判断其是否与统计出的皮肤区域的统计特征一致。为了能够向分类器提供一个较好的分类向量,需要在掩码图像基础上从原色情图像中提取特征值。在图像的索引与检索领域内,比较成熟的特征索引是颜色、纹理和一些低层的、简单的形状特征和物体空间方位关系。这些特征计算简单、性能稳定。颜色是一种重要的视觉信息属性,在图像索引与检索中是一种很有用的特征。颜色特征非常稳定,对于旋转、平移、尺度变化甚至各种形变都不敏感,表现出相当强的鲁棒性,并且颜色特征计算简单,因此成为现有检索系统中应用最广泛的特征。可以将图像检索与过滤的特征机制应用于色情图像的检测与过滤。色情图像本身的特征即是肌肤裸露,因此可以将色情图像的肤色特征作为其与正常图像的分类向量。基于肤色掩码从色情图像中提取并计算出裸露肌肤的颜色特征向量,然后通过分类器预测给定的图像是否为色情图像。通过对大量<WP=78>色情图像的分析,我们提取七个特征作为分类特征向量进行分类器的训练及色情图像的过滤。本色情图片过滤器利用BHO(浏览器助手对象)技术实现。BHO可以在浏览器的地址空间内引入处理代码。Internet Explorer 及其助手对象实际工作方式是程序在众所周知的、预先指定的磁盘空间寻找附加模块,加载、初始化它们,然后完成预先设计的工作。Internet Explorer可以使用浏览器助手对象编写组件——进程内的组件对象模型(COM)组件。这些组件和浏览器运行在相同的内存上下文里,并且能在可用的窗口和模块里完成任何操作。一个BHO能检测到浏览器的典型事件,如GoBack、GoForward和 DocumentComplete等;安装挂钩以监视消息和操作。BHO连接在浏览器的主窗口上;每创建一个浏览器窗口,就创建了该对象的一个新实例。在打开浏览器的时候,用BHO 技术开发的过滤器一起启动。
其他文献
随着我国保险事业的迅速发展,保险信息量也迅速增长,导致信息的不确定性呈指数增长,尤其是保险欺诈方面的信息不确定性,对社会具有很大的破坏效应及潜在的危害。然而,传统的
在计算机网络技术和分布式数据库技术迅速发展,多机协同工作技术日臻成熟的基础上,工作流产生并迅速发展起来。工作流将应用逻辑和过程逻辑分离 ,对生产经营过程或全部过程集成
信息技术的飞速发展,使软件产品应用到社会的各个领域,软件产品的质量自然成为人们共同关注的焦点。不论软件的生产者还是软件的使用者,均生存在竞争的环境中。软件开发商为了占
当今世界已进入信息时代,Internet的飞速发展和在全球范围的普及应用正给人类生活带来革命性的变化。Internet将传统意义上的物理空间转变成电子空间,把人们带入了一个网络社会
近年来,中国的数据中心产业规模不断扩大,海量的数据中心正面对着来自电力、冷却以及安防等方面的巨大压力。智能化的数据中心基础设施管理软件(DCIM)即将成为未来数据中心管
监控系统作为保护人们生命财产安全的有效辅助设施,是当前一个新的研发热点。如何利用现有的资源和技术,更好地实现视频图像序列中的运动目标跟踪、定位与识别,通过图像分析实现