融合图像语义与文本信息的色情图像判定算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:haojian19831212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网上丰富的信息在方便人们工作生活的同时,也可能给人们精神生活带来不良影响,尤其色情信息会对青少年的身心造成严重影响,而其中色情图像是色情信息的重要载体。对互联网上色情图像的甄别已成为网络信息安全中的一个重要方向。网页上图像判定技术多数采用直接分析图像内容的方法,而色情图像的特征信息可能存在于其图像内容以及其相应文本如图像文件名、所在网页中,在文本信息可获得的情况下,结合这些信息可以更好地表征图像,提高判定准确性。目前对两种信息进行结合进行判定的研究较少,并且均为对两种方法在结果上的简单组合,并未实现真正融合。本文针对目前单纯依赖于分析图像语义或文本关键词的色情图像判定算法的不足,提出一种融合网络图像的相关文本特征与图像特征语义的色情图像判定算法。在视觉词袋模型的基础上,将文本分析得到的文本特征与图像局部视觉元素特征进行特征级融合,并采用支持向量机分类器实现图像分类。本文首先对色情图像特征提取方法进行了研究,包括从图像内容中进行特征提取和从图像相关文本信息中进行提取两方面。图像内容特征是通过肤色检测和视觉元素的底层特征(如颜色、纹理、局部形态)分析,通过产生视觉单词的方法生成;图像相关文本特征是通过文本分析,利用预先构建的文本关键词库进行关键词匹配得到。在此基础上,本文提出了对两种特征进行特征级融合的方法,将两种特征向量按不同权重进行融合。将融合后的特征向量输入到SVM(Support Vector Machine)分类器中分类,最终得到完整的色情图像融合判定算法。此外,设计并实现了基于本文算法的色情图像判定原型系统,通过该系统对算法效果进行了实验验证。利用从网络上获取并进行人工标注的图像数据集进行测试,并在同等测试条件下与仅使用一种信息的算法,以及同样结合了文本信息与图像内容信息进行识别的色情图像过滤软件以及已有文献中的算法进行对比。实验结果表明,该算法可以有效结合图像内容信息和相关文本信息,具有更好的判定效果。
其他文献
近年来,随着Internet技术的高速发展,Web信息爆炸性增长,互联网已成为海量数据空间。人们从这些海量数据中得到自己需要的信息变的越来越困难,此时搜索技术变的尤为重要。随着搜
数据库技术是计算机专业的核心课程之一,也是其他各专业的基础信息课程。当前针对此课程的作业批改和考试主要采用人工阅卷。人工阅卷耗时耗力,效率低下,且客观性受到评阅人
随着计算机爆炸式的发展,计算机系统被广泛地应用于航空、金融、交通、电信、医疗、教育等与人们生活息息相关的各行各业之中,已经成为这些行业当中的信息维护和管理必不可少的
随着服务业的发展,越来越多的客户和提供者参与到服务的过程中来,这促进了大量的第三方的出现,BIRIS-Cloud服务平台是一个第四方的服务平台,拥有大量的第三方,我们把这些第三方称
随着现代医学影像技术和计算机技术的发展,医学图像的应用越来越广泛,医院中每年会产生大量的医学图像数据。对这些图像进行有效的组织和检索,能够更好地跟踪病情发展、查找相似
随着嵌入式技术、无线通信、信息网络和传感器等技术的快速发展,无线传感器网络(Wireless Sensor Networks,WSN)应运而生。近几年来,异构传感器网络(Heregeous Wireless Sens
在智能交通系统中,对无人监控场地中的运动车辆实现自动监控是现今研究的焦点,涉及到了图像信息采集、视频流处理和模式识别等各方面的知识。针对日常交通视频中的运动车辆检测
学位
WLAN在日常生活中应用广泛,而功率控制技术对于WLAN来说非常重要。功率的变化也会影响到路由表的内容,影响着无线接入设备的通讯范围以及网络系统整体性能。无线网络中,信道情况
随着测序成本的下降,测序数据越来越多,以后每个人都会有自己的基因组数据,个人基因组时代即将到来。而这个时候限制基因组研究不在是数据的产生,而是数据的分析,基因组数据可视化