基于内容的敏感图像识别技术研究

被引量 : 4次 | 上传用户:zrn851207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网敏感信息的广泛传播不仅严重危害青少年的身心健康,更增加了社会的不安定因素,因此,有必要对互联网敏感信息识别技术进行深入研究。基于内容的敏感图像识别技术可以有效克服传统的基于文本过滤的方法的不足,并成为敏感信息识别领域内的研究热点和主流发展方向。在本研究领域中,基于图像视觉词袋模型的敏感图像识别方法的效果较为理想,但也存在一些问题:1)该类方法未能很好地利用敏感图像中的肤色信息,且由于词袋模型固有的特点,使得图像表示中不能反映局部特征的空间信息;2)传统的基于图像特征训练的方法将敏感图像识别问题视为一种二类分类任务,但训练样本的不均衡性限制了该类方法进一步提升识别效果的空间。本文针对以上问题,基于流行的图像词袋模型的框架,提出了两种改进的算法。本文的创新与特色主要包括以下内容:1.提出一种融合肤色信息与特征空间信息的图像特征提取及表示方法。首先,为引入肤色信息,在图像特征提取中将肤色检测技术与规则网格SIFT特征采样相结合;其次,为引入图像的局部特征的空间信息并克服词袋模型中的特征无序性的影响,采用图像空间金字塔模型表示图像向量;2.提出了一种基于支撑向量机的敏感图像识别方法(方法一)。首先,利用本文提出的融合肤色信息与特征空间信息的图像特征提取方法对训练集进行特征提取和图像表示;其次,利用支撑向量机在包含敏感图像和正常图像的训练集中训练出二类分类器。实验表明,提出的算法具有优异的综合性能,且肤色信息与局部特征的空间信息的引入均有利于提高正确识别率;3.提出了一种基于一类分类算法的敏感图像识别方法(方法二)。在该方法中,通过分析敏感图像识别的特殊性,将其视为一种一类分类任务,即该方法试图仅利用敏感图像训练一类分类器。首先,在图像特征提取操作中,采用与算法一中相同的策略;其次,在图像特征表示步骤中,与方法一不同的是,视觉词典仅由敏感图像的特征聚类而得;第三,在得到训练集图像的原始词袋表示向量之后,利用随机森林算法评估一类视觉词典中的各分量的重要性,并保留重要的分量;第四,利用重要分量对图像的原始词袋向量进行特征优化操作,得到降维后的优化向量;最后,利用一类支撑向量机训练出一类分类模型。实验表明,本算法利用小规模敏感图像训练集训练出的分类器具有良好的综合性能。
其他文献
智能变电站为智能电网提供标准的、可靠的节点支撑,作为智能变电站“神经系统”的通信系统是连接变电站内各种智能电子设备的纽带,其实时性、可靠性直接决定变电站的可用性。采
目的探讨宁夏地区乳腺癌临床特点、病理特征及诊治模式的变化趋势,了解宁夏地区诊疗水平和现状,为提高乳腺癌规范化诊断和治疗水平提供科学依据。方法回顾性总结、分析宁夏医
高校学习中心是为高校学生自主学习服务的建筑,是现代高校图书馆的一种发展形态,近年来在国外已经有实践案例。本文从分析高校学习中心与传统高校图书馆的区别入手,通过案例
目的:了解银川市儿童青少年肥胖与代谢综合征的流行现状,探讨肥胖与代谢综合征各组分、炎症因子、胰岛素抵抗的关联。方法:采用分层整群抽样,在银川市三个区(兴庆区、金凤区、西夏
本文介绍了宾馆用氯漂与氧漂的漂白机理,比较了氯漂与氧漂的性能、工艺条件和应用范围,论述了氯漂与氧漂的发展前景。
<正> 香兰素即香草醛,学名:3-甲氧基-4-羟基苯甲醛,是一种较典型的广谱型香料,可作定香剂、变味剂、调味剂,广泛应用于食品、日用化工、医药、饮料、农业等各行业,是目前世界
目前,在国内中学数学教育过程中,一方面人们在大力倡导数学素质教育,同时一些地方的数学教学、考试或评价,与素质教育的主旨还很不吻合。但在国际上,关于学生数学素养的评价
风能作为一种清洁的可再生能源,越来越受到世界各国的关注与重视。预计未来20~25年内,世界风电市场每年将递增25%。随着国家对风力发电的重视,风力机近年来得到了广泛的应用和发
在城市化极速发展的今天,城市为了获得更大的经济效益和增长潜力开始探寻城市品牌形象的发展之路,通过建立良好的城市品牌形象并将它传播出去从而吸引投资、人才、旅游者以及公
本文首先对当前水泥行业的排放现状进行了简要介绍,进而对水泥行业的脱硝技术进行了论述。