基于深度学习的中餐菜品检测算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:woshizd0214
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能技术随着计算机算力的提升,取得了巨大进步,其应用也逐渐进入人们的日常生活。饮食作为人们生活中密不可分的部分,使得关于菜品识别技术的研究也逐渐变得火热。以菜品识别技术为基础,进行二次开发应用于自动化餐饮服务、健康饮食管理等领域,给人们的生活提供了极大的便利。目前,许多快餐店、学校餐厅、工厂食堂的打餐工作枯燥乏味,劳动力需求和成本颇高,使用服务机器人代替人工来完成打菜已经成为一种解决方案。服务机器人的一个重要子系统就是视觉系统,打菜操作的第一步就是通过视觉系统检测菜品的类别和位置,因此针对中餐菜品检测的算法研究具有重要意义。本文基于深度学习的一阶段目标检测方法,结合中餐菜品检测应用,从数据图像处理以及网络结构设计等方面进行优化,主要工作内容如下:1.中餐数据集构建。目前公开菜品数据集为适用于图像分类的数据集,图像中仅包含单个菜品目标,不适用于目标检测的方法。本文通过拍摄采集和网络扩充的方式,自行创建了一个具有37类菜品的中餐数据集,并对其进行统计分析,验证了该数据集的合理性。2.菜品图像预处理。针对菜品图像中存在的背景噪声和光照不均匀问题,进行图像预处理。本文采用了非局部均值技术来降低菜品图像噪声,采用了局部同态滤波算法均衡图像光照情况并增强细节特征。通过图像预处理提高图像的质量以提升模型的检测效果。3.菜品检测网络设计。针对池化或2步长卷积带来的图像特征丢失问题,使用间隔采样与堆叠的图像切片方式,在下采样的同时更好地保留图像的细节特征。使用具有通道注意力机制的残差单元结构,并结合跨阶段分层合并结构完成特征提取网络的设计,加强特征提取能力并降低参数计算量。增加特征融合路径充分利用细节特征和语义特征完成菜品的检测。4.重复预测框处理。针对中餐菜品检测的局部重复检测问题,提出新的预测框处理策略,使用新的预测框距离计算方式,对出现包含关系的预测框进行抑制。本文对提出的菜品检测方法在自建的中餐数据集上进行实验分析,实验结果验证了本文方法的有效性和优势,检测精确率达到95.1%,检测速度达到24帧/秒,达到预期效果。
其他文献
随着社会经济的发展和居民生活水平的提高,人们对鲜奶的需求量日益增多,如何将鲜奶产品又快又好的配送到零售商和消费者手里,是个值得关注的问题。目前鲜奶的冷链配送存在成本高、效率低、车辆利用率低等问题,为了提高鲜奶配送效率和服务质量,本文将共同配送的理念引入冷链鲜奶的配送体系中,而共同配送中一个关键的问题,是联盟企业间如何合理进行利益分配和成本分摊,这关系到企业的利益和联盟的稳定性,本文主要围绕城市鲜奶
电流传感器是一种将被测电流信号变换为电信号输出的测量仪器,在航天航空、医疗卫生、工业控制等领域具有广泛的应用。随着在国家战略布局和政策推动下,风力和光伏发电、新型现代化电网、新能源汽车等产业井喷式发展,对电流传感技术要求也提出了更高的要求,尤其是在大量程、高精度、高线性度的电流检测技术上的研究便有了十分重要的意义。本文首先对电流传感器不同技术的研究现状及发展趋势进行了阐述,并对磁通门式、霍尔式以及
随着当前市场上海产品需求量的增加,研究利用机器视觉算法识别水下图像中的海洋生物成为未来海产品捕捞的技术趋势。本文选择海胆、海参、扇贝和海星作为水下图像目标识别算法实验的对象,研究图像中海胆、海参、扇贝和海星多类别识别的相关问题。受限于复杂的水下环境,水下图像不仅含有大量分布无规律的小尺寸目标,还会受噪声、缺少照明、摄像头抖动等多方面问题的影响,导致水下图像存在噪声大、偏色失真、纹理信息缺失等缺点,
随着科技的进步和时代的发展,电子文档逐渐替代纸质文档成为汉字的重要存储方式。文字的录入方式也随着存储介质的变化,从传统的手写转变为键盘输入、图片识别、语音识别等更为高效的录入方式,但是这些技术不可避免的出现文字录入错误。在当今互联网时代,信息传递更为便捷,所存储的数据也越发庞大,这就使得人工纠正错误数据需要花费很多的时间和人力资源。中文拼写纠错技术的研究,不仅可以应用于拼音输入法、文档编辑工具、搜
基于2013—2019年中国省级面板数据,采用熵值法测度各省历年城乡高质量融合发展指数,使用面板模型实证分析数字经济对城乡高质量融合发展影响。研究结果表明,数字经济整体上能够促进城乡高质量融合发展;中介效应检验结果表明数字经济通过推动产业结构升级、优化资本配置水平来促进城乡融合。因此,应贯彻实施数字乡村发展战略,加强数字基础设施建设,完善数字治理体系,以发挥数字经济在城乡融合领域的优势。
随着物联网(Io T)行业的发展,科技的进步,人们生活中涌现出大量新应用,如无人驾驶,智能家居,远程医疗等。传统的云计算架构已无法满足新应用的低延迟、高带宽、低功耗等要求,移动边缘计算(MEC)成为解决该问题的重要技术手段。计算卸载技术利用在MEC网络边缘布置计算服务器来帮助用户就近计算,节省了用户任务计算时间,使网络能够支持高时延要求的应用服务,已经成为MEC技术中重要的研究方向,而如何将任务合
随着经济的飞速发展和人民消费水平的日益提高,各类电子电器产品更新换代速度不断加快,因此产生了大量电子废弃物。电子废弃物中含有大量有害物质,若电子废弃物未经过正规的分解回收,则会对居民的身体健康和生活环境产生较大危害。同时电子废弃物又具有潜在经济性,其拆解处理后获得的金属、材料和可再利用资源有极高的经济价值,但目前电子废弃物回收行业还未形成完整的产业链,缺乏在运输过程中的成本控制。与正向物流相比,由
目的:本次研究的目的主要是为了分析产房助产士的护理风险因素以及如何针对这些风险提出相关的防范措施。方法:通过总结本院的产房助产士在护理中遇到的风险因素,根据这些实际的风险因素制定出相关的防范措施并且将这些措施运用到实际的产房助产士护理过程中,对于采取这些防范措施前后病患的恢复情况进行分析。结果:通过进行相应的防范措施以后,产妇明显对于产妇助产士的工作满意度提升,病患与医生之间的纠纷显著下降,P<0
随着通讯技术和定位技术的迅速发展,移动目标轨迹语义分析和位置预测问题在日常出行、国防预警以及疫情防控等场景中有着越来越重要的研究意义。现有研究大多根据运动轨迹本身的运动规律进行数据挖掘,然而目标运动轨迹不仅包含目标运动状态信息,还包含目标在每一时刻与周围环境的交互行为信息。语言是人们交流和处理自然界环境信息时最主要的信息载体,包含大量的语义信息,所以本文从语义层面出发,对目标轨迹语义分析与位置预测
随着科技的发展,机器人在各个领域得到了广泛的应用。作为机器人的一个重要分支,轮式移动机器人近年来受到了广泛的关注。然而,由于轮式移动机器人的非完整约束、欠驱动、非线性等特点,轮式移动机器人的运动控制具有极大的挑战性。当前大部分的研究都是在理想条件下进行的,即车轮与地面之间满足“纯滚动且不打滑”条件,这在实际的工作环境中很难满足,例如,当机器人在松软光滑的地面上移动或高速急转弯时,车轮与地面之间会发