基于视频分析的驾驶员手持通话行为检测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jerryhua1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来因汽车驾驶员注意力分散导致的交通事故占比居高不下,其中使用手持电话的行为是导致驾驶员注意力分散的一个重要原因。尽管全球已有许多国家与地区明确禁止司机在行车途中接打手机,但在执法过程中,存在对汽车司机行车途中接打手机行为难以监管的问题。因此,以视频记录、分析的方式替代人工监控和判断有迫切需求。以视觉分析的方式检测驾驶员是否在驾驶过程中接打电话,顺应道路交通安全监管需求,具有实践意义。本文设计了一种检测系统,即基于视频分析的方式检测驾驶员在行车过程中是否使用手持电话并对该检测系统进行了研究、设计与检验。该检测系统以在驾驶室内安装前置摄像头采集驾驶员图像作为前置条件。检测系统主要包含三个子模块,分别为感兴趣区域定位、模式识别以及运动检测。感兴趣区域定位模块包括人脸和耳部区域定位,采用MTCNN实现人脸检测及人脸对齐并通过人脸区域确定驾驶员的位置,依据人脸“三庭五眼”的几何比例关系可大致确定耳部区域从而确立感兴趣区域。模式识别模块用于分类手持通话和正常驾驶图像,在感兴趣区域内根据人脸特征点位置去除眼睛、鼻子以及唇部非肤色区域,采用单高斯模型作为肤色度量模型动态自适应的计算出概率密度阈值,利用该阈值分割出耳部区域的手部图像,肤色信息作为下一步特征提取的输入。提取脸部及耳部区域内的手部肤色图像的PCA-HOG特征,然后采用到SVM算法分类特征用于判别打电话和非打电话图像。运动检测模块用于检测唇部运动,根据人脸特征点定位确定的唇部位置,通过唇部宽高比计算张合度,再根据张合状态持续时间与频率来分析唇部运动并确定驾驶员是否在说话,最后通过统计连续多帧图像的手持通话行为分类结果以及唇部运动结果从而最终检测出驾驶员是否存在手持通话行为。本文在Linux环境下使用Python基于Tensorflow和Scikit-learn机器学习框架实现了该检测系统,并通过自建的驾驶员打电话行为数据集训练和测试,最终实验结果表明本检测系统具有较好的鲁棒性和实时性可以有效的检测驾驶员手持通话行为。
其他文献
我国是世界上泥石流灾害最严重的国家之一。永吉县作为吉林省泥石流灾害易发区之一,频频遭受重大泥石流灾害,泥石流摧毁房屋,掩埋道路,制约了当地经济发展,给人民带来了严重
土壤微生物常作为土壤质量变化的重要参数。盐度作为影响土壤微生物的主要因素已经进行了部分研究,Sardinha认为盐度对土壤微生物的影响比重金属更严重。目前相关研究大多集
城市拥堵区域的正确和及时发现,能够为交通管理部门提供相应的应急措施和道路基础设施建设的改善建议,也能为市政规划部门提供非常有价值的城市建设指导意见。本论文论述的城
产业集群是一个国家或地区加快经济发展、提高产业国际竞争力的有效载体。创新绩效是衡量产业集群发展水平和发展潜力的重要指标,随着产业集群的快速发展,对于集群企业创新绩
本文我们研究紧致Hausdorff空间上复值连续函数全体构成的C*-代数C(X)上的Riemann度量及其性质.在第一章中我们给出了文章的背景介绍以及一些常用的基本概念和定理.在第二章
秦岭造山带是一条由多期次构造运动叠加改造从而塑造成的复合型造山带,是连接华北板块和扬子板块的重要纽带。南秦岭内广泛记录了新元古代岩浆事件,对于这些岩浆记录的研究能
图像分割是指根据图像已有的图像低维视觉描述特征,按照所设计的一定相似性准则将图像中在某些特征上存在相似性的区域划分成同一类别,并将图像中感兴趣的部分从图像中分离出
本论文是在非线性共轭梯度算法中已有的研究成果上进行的,主要基于DDL以及DLVHS方法进行研究和修正.为了能得到理论和计算都比较好的新共轭梯度算法,在Wolfe线搜索和强Wolfe
研究背景:脑白质高信号(WMH)是脑内小血管退行性改变的主要影像学表现之一,在老年人中常见。由于其发生率高,且与老年人认知功能障碍、痴呆、卒中等疾病密切相关,了解其损害脑
随着互联网的不断发展,互联网中数据量也在不断的增多。然而大部分数据以文本的形式存储,如何有效的将数据从文本中抽取出来是一个十分重要问题。实体关系抽取作为信息抽取的