【摘 要】
:
汽车保有量的不断增加在带来便利的同时也给交通增加了巨大的压力,不规范的驾驶行为是导致交通事故频发的重要原因,因此对驾驶行为进行监测与规范应成为避免交通事故的重要手段。针对上述问题与需求,本文做了以下几项工作:首先,本文研究了基于迁移学习的驾驶行为识别方法。该部分内容主要分为卷积神经网络的研究、图像增强技术和驾驶行为识别的仿真实验设计与分析。针对卷积神经网络的研究,本文先介绍了卷积神经网络的基本原理
论文部分内容阅读
汽车保有量的不断增加在带来便利的同时也给交通增加了巨大的压力,不规范的驾驶行为是导致交通事故频发的重要原因,因此对驾驶行为进行监测与规范应成为避免交通事故的重要手段。针对上述问题与需求,本文做了以下几项工作:首先,本文研究了基于迁移学习的驾驶行为识别方法。该部分内容主要分为卷积神经网络的研究、图像增强技术和驾驶行为识别的仿真实验设计与分析。针对卷积神经网络的研究,本文先介绍了卷积神经网络的基本原理以及当前业界流行的Alex Net、VGG、Xception、Inception Res Net和Efficient Net等模型的基本结构。另外,本文在State Farm图像数据集的基础上进行了基于迁移学习的模型训练,并对模型性能进行了评估。其中,State Farm中包括安全驾驶,发短信,操作收音机以及与乘客交谈等十种常见的驾驶行为。最后,仿真实验在上述五种模型上进行了测试,准确率最高达到了89.32%。但是基于图像的驾驶行为识别存在着难以识别相似动作的瓶颈,因此考虑将声音加入识别过程。其次,本文研究了基于VAD算法的人声检测。该部分内容主要介绍了相关音频数据集、常见的语音处理方法、VAD算法的人声检测原理和人声检测实验设计与结果分析。该部分最后实现了基于VAD算法的人声检测实验,在共计21424条音频数据上的准确率达到99.98%且单条运行时间为9.72ms。最后,本文提出了一种基于多模态深度学习的驾驶行为识别方法。该部分内容主要包括多模态深度学习的框架介绍、多模态数据的融合、仿真实验设计与结果分析。首先对多模态深度学习的理论与方法框架进行阐述。其次,在图像与音频研究工作的基础上,该部分将图像与音频结合,利用人声检测将驾驶行为图像划分为有人声的驾驶行为图像和无人声的驾驶行为图像。最后,仿真实验结果从原本的89.32%提高到96.05%。结果表明,基于多模态深度学习的驾驶行为识别方法是行之有效的。此外,本文设计了一套驾驶行为识别系统可用于驾驶行为的识别。
其他文献
随着互联网、大数据、云计算技术的发展,教育信息化程度不断加深,数字教育资源日益庞大,数字教育产业已经具备了良好的基础[1]。众筹众创模式作为现今互联网经济中新兴的模式,具有灵活、低门槛、传播快的特点,有利于新技术的发展与推广。然而教育资源来源广泛、数量巨大、结构不一、内容分散且冗余,导致学习者难以快速获取有效资源。为了加强数字教育资源整合力度,提高信息资源的融合水平,构建高质量的数字教育资源库,本
物联网的应用和普及为远程医疗提供了基础,医生可以通过血氧仪等采集类设备实时获取异地病人的健康数据,并通过精密摄像头、智能音频设备为异地病人进行实时问诊,甚至可以通过精密的远程智能手术台为病人进行远程手术。远程医疗的出现,使得世界上先进的医疗资源得以更好地共享,远程看病、远程给药、远程手术等操作正在不断地帮助异地不便的病人解决医疗需求。实际场景中,远程医疗应用往往需要医院域、病人域、药房域等医疗信任
随着近代工业的飞速发展,注塑成型制品显现出独天得厚的优势,其在国防、医疗、航空航天等各个行业的应用也日益广泛。目前国内军用高精度空心杯电机电枢大量依赖进口,注塑封装水平较低,精度不高,已经成为制约我国高端武器装备持续发展和性能指标提升的重要瓶颈因素。在此背景下,对军用高精度空心杯电机电枢注塑封装工艺的研究迫在眉睫。本文通过对国内外相关研究成果的整理分析,综合了注塑数值模拟、正交试验、神经网络以及计
互联网的迅猛发展给用户提供了丰富的信息资源,满足了用户在大数据时代对信息的需求,但是用户在对信息进行收集、过滤、整理和归纳时的能力是有限的,特别是在应对大量数据时,用户想要从中获得可用的信息就变得异常困难。个性化推荐系统的出现不仅能够解决这个问题,还能提高用户检索信息的覆盖面,制定个性化推荐内容。其中,推荐算法的应用是上述功能实现的重要前提条件。协同过滤推荐算法因其实现方法简单、模型扩展性强、推荐
随着医学成像技术不断地发展与革新,医学影像在临床诊断中具有重要作用。由于成像模式不同,不同成像设备采集到的医学图像呈现出不同的模态,反映出人体中不同的结构信息。然而单一模态医学图像仍不能全面地刻画病灶信息。图像融合是一种将多模态图像融合生成一幅融合图像的图像处理技术。融合图像能有效提高医学图像辅助诊断的准确度和效率,因此研究多模态医学图像融合具有一定的理论和实际应用价值。现有三维的图像融合方法较少
随着移动设备和Web2.0技术的迅猛发展,基于位置的社交网络(Location-based Social Networks,LBSNs)逐渐在人们的生活中普及。目前主流的社交应用每天都在产生TB级别的时空数据,这些数据通常以签到数据(check-in)的形式记录,基于这些数据,学者们提出了多种类型的位置推荐模型,但其在处理数据稀疏、冷启动等问题时表现不佳,且时间效率与推荐精度低。针对这些问题,本文
深度学习凭借海量训练样本和不断提升的硬件算力的支持,在计算机视觉的多个领域里获得了巨大成功,基于深度卷积神经网络的模型目前已成为目标检测领域的主流。基于深度学习的目标检测分为两个研究方向:一是高精度检测,借助性能强大的运算设备刷新模型在通用基准数据集上的检测精度;二是轻量级检测,侧重于模型的轻量性和实时性,在检测精度不显著降低的同时尽可能减小模型的规模,使其更适合部署于实际应用场景中。当前的轻量化
运动目标跟踪是计算机视觉技术的一个重要研究领域。由于尺度变化、目标被大面积的遮挡、目标与背景相似度过高等问题给目标识别、运动目标跟踪带来了诸多的研究难点,多帧差分法、均值漂移以及运动估计给上述难点提供了可靠的解决方案。本学位论文以运动污染物的检测与跟踪作为应用目标,首先设计了一种基于均值背景法的运动污染物检测方法,然后设计一种基于状态估计自适应漂移的运动污染物跟踪算法,解决在目标污染物被遮挡情况下
《受伤的新娘》是歌剧《巴亚捷》中著名的咏叹调,由巴洛克时期著名作曲家维瓦尔第创作,这首作品显示了巴洛克歌剧咏叹调的艺术魅力,堪称为抒情咏叹调中的经典之作。本文介绍了维瓦尔第《受伤的新娘》这首咏叹调的创作背景,故事梗概以及歌词、伴奏、曲式结构的创作特点。结合自己的实际演唱,分别从歌唱位置、气息、咬字、情感表达这四方面进行演唱分析。并且对巴托丽和曹秀美的演唱进行对比分析。本课题的研究是本人对过去三年研
重唱是提高歌剧表现力最经典的方式之一,它是一个多人合作的演唱方式,通过两个或两个以上的声部、音色进行和声对位来打造声音的立体效果及音乐的张力性。本文将以歌剧史上第一批歌剧的作者,意大利作曲家蒙特威尔第先生的歌剧《波佩亚的加冕》中的二重唱《我也望着你》为基础,采用文献资料整理总结以及自身在学习实践中对二重唱的经验总结的方法,对二重唱作品《我也望着你》的旋律、曲式和声、演唱时对声音的控制以及舞台表演、