论文部分内容阅读
近几年,随着智能手机和平板电脑等移动终端的应用,移动互联网取得了飞速发展,图片成了人们日常生活中交互最为频繁的数据类型之一。由于不良图片的危害巨大,因此网络内容安全越来越多地被人们关注。基于内容的图片过滤技术直接从图片的内容出发,相比于其他方法具有更好的识别率、适应性和实时性,已成为该领域的一大研究热点。本文从不良图片的内容特征出发,基于机器学习和模式识别技术,设计并实现了一个完整的不良图片过滤系统。
全文首先根据不良图片的内容特征,从肤色识别和语义分析两个方向,分别介绍了当前国内外的研究现状,并着重分析了朴素Bayesian、色度平面规划和灰度共生矩阵等几种基于像素点和区域的肤色分割算法,以及SVM和AdaBoost等语义分析算法。由于这些算法在识别精度、适应性和实时性方面都有着各自的优势和不足,因此本文在改进Bayesian和AdaBoost等算法的基础上,把纹理分析、Bayesian模型、CascadedAdaBoost级联分类器和颜色直方图四个模块有机地组合起来,设计了一种实时高效的不良图片过滤系统。大量的实验数据和性能分析表明,该系统能够较好地满足实际需求,并在提高适应性和降低误检率方面有着突出的贡献。
最后,本文基于Matlab、OpenCV和MFC实现了上述系统,主要功能分为训练和测试。其中对Bayesian模型的训练是在Matlab平台下实现的,相应的库文件以“.txt”文件形式读写;而对级联分类器的训练则是基于OpenCV来完成的,训练的各级强分类器则以“.xml”格式存储。而在实际测试的过程中,通过调用这些“.xml”文件,把数据导入相应的函数中,实现过滤功能。测试窗口既可以完成对单张图片的处理和结果显示,也可以实现批量处理,在将结果存入目的路径的同时显示相应的性能指标值。