基于SIFT算法的ATM视频人脸识别系统研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:a327581460
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,模式识别技术在计算机技术充分发展的作用下得到了广泛的应用。其中人脸识别技术作为模式识别的关键技术已经应用在方方面面。人脸识别技术多指人身份确认等信息,人脸图像获取最佳途径就是通过视频监控获取以及通过身份证照片获取。ATM取款机的应用也越来越广,与此同时一些不法分子利用ATM取款机犯罪的频率也越来越高,具体表现在非法取钱、非法盗取他人银行卡密码等行为。如何有效的对人们取款过程进行监控,有效的对取款人进行保护,这一问题成为当代研究的热点问题。由于ATM取款机的视频提取结构特征比较明显,它是由一系列图像的以取款顺序的条列组合而成的。视频条目在结构时间序列上较为固定,通常取款人单个出现,取款时每帧图像内容变化不大,运动较小,且取款人到ATM取款机前插入银行卡往往就是一个人取款的开始,从银行卡中取卡就是取款结束。本文视频人脸识别过程共分为以下过程:首先将获取到的视频统一格式压缩,把压缩后的视频分解成单帧图像,去除背景图像帧,将剩余的每帧图像按时间先后顺序排列储存。然后对图像组中的每帧图像进行预处理,储存为待处理图像组。然后将处理过的图像组中每帧图像按照基于肤色的算法利用预先训练出的肤色阈值进行人脸检测,然后去除图像少部分连同区域,最后将检测后的图像进行膨胀以便扩大肤色区域,储存为待处理图像组,将其中的图像二值化处理,水平累加投影,大致绘制出直方图曲线,按此曲线将所有视频图像分为正脸图像类、左侧脸图像类和右侧脸图像类;经过大量视频训练,ATM取款视频一般时间长度为20秒左右,按照最低avi压缩格式15帧/秒压缩,大概有300帧图像左右,选择10帧正脸关键帧方能代表此视频。计算正脸图像类中检测出肤色区域与整幅图像的比值,求出所有图像的比例值均值,按照比值顺序将每类中的图像序列重新排列,取出前五帧图像作为前五帧关键帧,然后将以五帧图像为一组进行分组(不够五帧的最后一组按噪声图像处理),分别计算每组中图像序列号与比值的方差和比例值均值,如果每组图像的比例值均值大于所有图像的比例值均值则保留此组图像,然后将两个方差相加,求出最小的一组作为另外五帧关键帧。如果正脸匹配识别不满足要求,则对于左、右侧脸图像类各选取投影直方图曲线峰值最明显的五帧图像作为辅助关键帧待识别匹配。最后运用SIFT局部特征匹配算法将提取的10帧正脸关键帧与人脸库图像进行特征匹配存储匹配结果,然后利用RANSAC算法将匹配后的图像做去除误匹配处理。
其他文献
进入21世纪以来,我国人口老龄化现象越来越突出,城市用工荒问题越来越严重,这与人们不断提高的生活水平以及迫切希望从繁重的体力劳动中解放出来的愿望产生了极大的矛盾,这一矛盾
中国画作为我国文化艺术的精髓,其数字化管理不论是在其保护方面,还是历史文化传播和研究方面都具有至关重要的作用和意义。而如何方便的管理及分类中国画则成为了研究重点。
ZigBee是一种新兴的专为低速率无线个域网而设计的低成本、低功耗的短距离无线通信协议,能够广泛地应用于军事、工业、智能家居等领域,它的广泛应用必将为人们的日常生活带来
虚拟合作联盟是基于共同的战略目标,将具有不同核心研究能力和资源的组织机构联合起来,形成一个网络环境下的联盟体,通过组建虚拟团队来完成合作任务,实现其资源的优化组合,
近年来,随着宽带Internet网络的广泛普及以及多媒体技术的迅速发展,人们对Internet视频信息越来越倾向于以形象直观的方式获取。基于网络的视频流实时传输技术的研究正逐渐被
网络加密卡是一种带有网络接口并且能够对信息进行加解密的硬件卡。通过DM9000网卡实现网络接口,通过FPGA电路实现加解密核,利用VHDL编程实现了高速硬件加密传输,增强了信息的安
食品仓库是食品供应链中的重要枢纽,因此,食品仓库环境的好与坏,直接影响着食品本身的质量和整个食品供应链的安全状况。为了保证仓库内食品新鲜不变质并且不发生人为灾害,本
近年来,随着无线通信技术和嵌入式系统等技术的发展,各种新技术相互交叉融合,涌现出了许多用于数据信息获取、处理的新产品、新模式和新技术,Zigbee技术便是其中的一种。Zigb
网络技术和图像复制技术的发展,使得图像的传播和再复制过程更方便和快捷。通过多种数字处理软件和高质量的图形图像输入输出设备,可以轻易地对原作品进行任意编辑、修改并非
人机交互就是通过输入输出设备,实现人与计算机之间的一种有效互动方式。该领域技术的快速发展使得人机互动更加舒适,更加自然,并应运而生多种人机交互模式,譬如数据、触控设备、声波、人体动作等模式。本文所涉及的投影-摄像系统就是采用投影仪、摄像机作为输入输出设备,结合人体动作作为交互模式的人机互动系统。它是一种新型的多媒体互动平台,采用先进的投影显示技术、计算机视觉技术、模式识别技术和人工智能技术来营造一