论文部分内容阅读
随着互联网上海量人脸图像的出现,快速有效的人脸图像检索方法变得越来越重要。如何有效地对海量人脸图像处理与检索逐渐成为当今研究热点。海量人脸图像检索存在的主要问题包括:(1)海量高维向量的快速检索问题;(2)海量人脸图像的快速检索问题。针对以上问题,本文的具体工作和成果如下:1.海量高维向量的快速检索方法的研究针对海量高维向量的快速检索问题提出了两种方法。第一种为基于分布式LSH的高维向量快速检索方法,以视频文件的特征为高维向量的来源,通过哈希函数映射特征矢量,以映射后的矢量值所在区间构建索引,根据返回的相似帧集合计算库中各视频与查询视频的相似度。第二种为基于SimHash的高维向量快速检索方法,提取视频文件关键帧的DCT时空特征,进行SimHash之后生成视频的签名。计算查询视频的签名与视频库中所有签名的汉明距离,通过汉明距离的检索完成相似视频查询,实验结果表明采用该方法在约1万个视频的视频库中检索相似视频的平均准确率≥90%,平均召回率≥90%,平均查询时间0.11秒。2.支持海量人脸图像快速检索的索引结构的研究为了在大规模的人脸数据库中提取出特定人脸,提出了一种快速有效的相似人脸检索方法:首先提取人脸图像的LBP特征,通过建立投影矩阵将特征从欧几里德空间映射到汉明空间实现降维,再采用改进的多比特编码方法对降维后的特征进行编码并生成图像签名,以曼哈顿距离取代汉明距离衡量签名之间的相似度,最后根据图像签名集合构建倒排索引表,通过倒排索引表高效地查找相似图像。实验表明,在包含20万张人脸图像的实验数据集下,该方法的平均准确率为78%,平均检索时间小于0.15秒。3.基于人脸检索的网吧上网人员监控系统的实现针对实际需求设计了网吧上网人员监控系统,系统由前台客户端和后台人脸检索平台两大模块组成。后台人脸检索模块选取人脸基准字典作为人脸库图像的视觉单词量化标准,将人脸划分区域后提取各个区域的特征并按最近邻原则依照人脸基准字典对每个区域进行身份量化,最终人脸图像由身份量化值组成的视觉单词表示,并以视觉单词构建倒排索引实现了相似人脸图像的快速检索。最终实现的网吧上网人员监控系统具有操作简单便捷、界面友好、检索结果准确的特点。目前该系统正在合肥市网吧试运行。