基于深度学习的中式菜品识别方法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:aspoptyy4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来人工智能的发展越渐火热,计算机视觉领域的研究发展越来越贴近我们的日常生活。随着我国全面进入小康社会,人们对于饮食健康的问题日益重视,如日常生活的饮食监控、营养分析、菜品推荐系统等等。因此,基于计算机视觉的菜品图像识别技术成为了当前研究的热点之一。但是,目前的菜品图像识别的研究应用多放在西餐和日料中。中式菜品由于其种类繁多复杂,不同菜品之间也有可能非常相似,相同菜品也有可能差异过大。因此,对于中式菜品图像识别方法的研究仍是一个难点的问题。为了使研究内容更贴合实际应用,本文选取了日常生活比较常见的中式餐厅作为应用情景,在某高效食堂进行了为期一年左右的数据采集工作。然后进行了多目标中式菜品识别方法的研究,并且设计了中式菜品识别系统。本文将中式菜品图像的识别分成了如下两个部分:首先将盛满多个菜品的菜品托盘图像输入到菜品位置检测网络,进行菜品位置的定位提取。然后将提取的多个菜品图像依次输入到菜品识别网络模型当中,最后经过识别网络输出各个菜品的类别。本文的主要研究内容和创新性成果如下:(1)构建了菜品位置检测网络Food-Dnet目标检测网络。该检测网络选用了网络深度较浅的Res Net-18卷积网络作为主干网络,并对其改进融入了可变形卷积。同时,将检测网络的Head部分也引入了可变形残差模块,这样做可以在一定程度上弥补降低网络深度所带来的精度损失。为了提高提取空间特性信息的有效性,又将Neck网络部分的FPN结构换成了FPN+PAN的结构。经实验表明,Food-Dnet目标检测网络在数据集Food-C上达到了96.2%的m AP值,并且检测速度相比YOLOv3等主流的目标检测网络有着明显的优势。(2)提出一种基于改进残差网络的中式菜品识别模型RNA-TL(Res Net with Attention and Triplet-Loss)。该识别网络先通过融合多尺度特征提取深层次图像语义信息,然后又增加一层注意力机制分支从而给予图像中重要部分更多关注。最后,将得到的特征向量输入SVM中进行菜品图像的分类,且其中使用了改进的三元组损失(TripletLoss,TL)函数进行类间相似度计算。经实验表明,RNA-TL模型在中式菜品公共数据集Food208可以达到83.6%的识别准确率,以及在数据集Food292上达到了90.31%的识别准确率。
其他文献
随着计算机科学技术的发展,人工智能逐渐走进人们的生产生活中,促进了社会生产生活模式的转变。饮食作为人类日常生活的重要组成部分,出现了许多与饮食相关的研究,菜品识别是进行其它饮食相关研究的基础,基于人工智能技术的菜品识别是目前比较热门的一个研究领域。目前深度学习已经在图像识别、目标检测、自然语言处理等多个领域得到了广泛应用。针对中餐菜品种类繁多、食堂人工结算效率低下的问题,本论文开展了基于图像识别技
车辆目标检测技术是自动驾驶的关键技术之一,它要求实时并精确地获取车身周围的车辆信息,以提升驾驶人员的主动安全性。现阶段的车辆检测方法大都基于深度学习,可划分为两类:两阶段检测算法和一阶段检测算法。两阶段算法检测精度较高,但检测速度还达不到实时的要求;一阶检测算法基本满足实时要求,但检测精度较低。YOLOv3作为工业界常用的一阶段检测算法,兼具较好的实时性与检测精度,但将其应用于车辆检测场景时,实时
近年来,霾污染严重危害人类身心健康和影响社会经济发展,已成为中国最受关注的环境问题之一。本文利用统计分析和数值实验,揭示了华北地区前冬霾日数与9–10月波弗特海西部的海冰之间的显著正相关关系(R=0.51)。海冰正异常通过辐射冷却作用,造成波弗特海和阿拉斯加湾的地表风速降低,在随后的11月出现海面变暖的现象。白令海、阿拉斯加湾的海温异常起到了桥梁的作用。温暖的洋面通过加热上方大气,形成了有利于霾污
为了提高人类主动应对全球气候变化的能力,科学家们提出可以通过地球工程人为地为地球降温。其中,卷云稀疏化作为影响地气辐射平衡的地球工程方法开始受到广泛关注。为充分发挥卷云稀疏化的全球降温潜力,本研究对以往研究中使用的卷云播种方法进行了改进并使用第五版本通用大气模式(Community Atmosphere Model version 5,CAM5)进行模拟试验。首先,对比分析了以往研究中使用的播种方
声源定位技术是利用时延估计、波束形成等算法,处理采集到的声波阵列信号,得到声源目标方位的技术,在声呐、噪声检测、故障诊断、智能产品等领域具有广泛和潜在应用前景。随着机器人技术的发展,将声源定位技术和机器人平台相结合,可以更好地实现对声源目标的定位。机器人声源定位一方面可以辅助机器人感知周围环境中声源目标的方位,另一方面还可以利用机器人移动的特点,测量声源目标的相对距离,解决被动声源定位中难以确定声
浙江是我国水稻的主产省份,而直播稻由于具有省力、省工、简化的栽培优点,在浙江栽培面积逐渐扩大,目前占浙江省水稻栽培的36%。但直播稻的产量受气象条件影响波动明显,开展直播稻气候适宜性评价,是保证直播稻高产稳产的重要措施。为此,本文以“甬优15”水稻为材料,在浙江省龙游农业气象试验站进行两年10个分期播种试验,分析了播期对直播稻生长发育及产量的影响,并对ORYZA2000模型进行定标和验证,利用浙江
南海及邻近海区对海洋环境观测有着重大的需求,推动该地区海洋环境观测技术的发展对于实施海洋强国战略具有重要意义。鉴于目前海上观测能力的不足,需要开发一种新的高精度且自动化的海空协同观测系统,这就要求研发多智能体协同控制算法,协同无人艇、无人机等多种智能设备,实现海空协同观测任务。经调研,传统的控制算法过于依赖系统模型参数,也未考虑到通信时延因素对系统的不确定性影响。此外,由于任务不同、约束不同,传统
焦化产品是工业生产的主要原料之一,焦炉炼焦生产过程中焦炉煤气压力是影响焦炭产量和质量的重要参数,目前很多焦化工厂对于焦炉内煤气压力的控制效果并不理想,一方面影响生产效率和质量,另一方面造成了大量的煤气浪费。因此研究焦炉炼焦过程中煤气压力的控制有着重要的意义。在实际焦炉系统中,被控系统通常不是理想系统,内部存在不确定性、非线性以及时滞等多种系统内部因素,另一方面也会受到各类外部干扰的影响,这些因素使
近年来,深度学习技术的飞速发展,越来越多的人工智能产品也能落地了。伴随着深度学习技术在安防监控,银行金融,自动驾驶等安全敏感任务上的应用,深度学习模型作为一个黑盒的端到端模型,其安全性和隐私性也越来越受到人们的关注。对抗样本技术更是成为了深度学习研究的热门领域。虽然基于极大极小值优化的对抗训练方式成为了防御对抗样本攻击的最有效方法,但是对抗训练中存在两个问题:对抗训练比正常训练需要更大的模型容量,
刚性四足机器人具有较低的灵活性和较高的能耗,刚柔耦合四足机器人腿部设计有柔性系统,在往复运动过程中可以起到蓄能发力、节省能耗和提高运动高度的作用,对于复杂工况具有更好的通过性,被广泛应用于军事、工业探测和民用等诸多领域。现有的基于液压的柔性系统价格昂贵,人们需要一种价格更为便宜的柔性方式。本文的主要研究内容如下:(1)设计了一种基于弹簧机构的刚柔耦合四足机器人。建立D-H参数表,推导出刚柔耦合四足