精细粒度的菜品识别方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:qzspk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
精细粒度的菜品图像识别是计算机视觉研究领域的一个重要课题。随着计算机硬件算力的提高以及智能生活的到来,菜品识别技术将广泛应用于智慧餐厅、健康饮食等领域。当精细粒度的菜品图像采用目标检测算法进行识别时,会出现错检和漏检等问题。为解决此类问题,本文构建新的中餐菜品数据集,并提出三种新的菜品识别方法。本文主要研究内容如下:1.本文构建了一个新的中餐菜品数据集。本文通过观察日常饮食中常见的菜品,确定35种菜品类别,并利用多种渠道完成图像收集工作。由于每张图像包含多个不同的中餐菜品,现有公开数据集中没有此类数据集,因此本文对新的数据集从图像数量、菜品标注框、标注框宽高比等角度进行分析,证明本文构建的多菜品数据集更具优越性。2.本文研究了基于相邻特征信息融合的菜品识别方法。针对通用目标检测特征融合方式的局限性,本文对相邻的多尺度菜品特征进行两步融合操作,充分利用不同尺度菜品特征谱包含的信息,提高多尺度特征信息的利用率,增加菜品特征谱的细节信息。3.本文研究了结合多感受野注意力与特征通道加权的菜品识别方法。针对单个感受野注意力机制菜品信息较少的局限性,本文提出利用多个感受野特征分别进行注意力操作,并将这多个感受野注意力融合起来。该方法提高了菜品特征谱的细粒度信息,增加了菜品特征谱的不同层次信息。同时为了突出菜品特征谱中重要通道的作用,本文再次利用多感受野特征对新的注意力特征谱进行通道加权操作,进一步突出多感受野注意力的重要性。4.本文研究了基于目标边界框再定位的菜品识别方法。本文从提高菜品位置定位能力出发,首先介绍常用定位损失函数,并通过常用损失函数提出一般化的定位损失函数,然后分析菜品数据集选择合适的损失函数。同时改进原有目标检测算法,提出基于目标边界框的再定位方法,最后将此方法与新的损失函数结合起来形成本文方法。本文在新构建的中餐菜品数据集上对以上工作进行验证,上述三种菜品识别方法的准确率分别为84.31%、84.60%、85.28%,实验结果表明本文的菜品识别方法能够有效提高识别准确率,减少菜品识别的漏检和错检问题。
其他文献
文化创意产业是21世纪具有活力的新兴产业,借鉴文化创意产业发展模式,将文创思维融入图书馆发展是图书馆转型发展的重要手段。从少年儿童图书馆文创产品发展现状出发,分析了
广告作为现代社会的一种重要的信息传播方式和人们获取信息的重要手段,不仅参与建构人们的消费观念,还在一定程度上影响着人们的审美认知。日化产品是人们生活的必需品,日化
习题课是数学分析教学过程的一个重要环节,是提高教学质量的有效手段。我们在教学实践中,结合课堂,适当地补充拓展;结合作业,有效地利用错误;重视反例、反问题,引导发散思维;
当代大学生的文化自信建设影响着整个中华民族伟大复兴事业的发展。在当今全球化及多元文化的社会背景下,相当一部分大学生却出现了文化自信不足的现象。长征精神涵盖着中华
【目的】为研究不同施镁水平对泸州地区烤烟烟叶产量和品质的影响。【方法】本试验以5个施镁水平(0、50、75、100、125 kg/hm2),3次重复开展大田随机区组试验。【结果】结果
解淀粉芽孢杆菌是一种根际促生菌,具有促进植物生长、增强植物抗逆、抗病能力等作用。长链非编码RNA是一种具有多种生物学功能的RNA转录本,是植物生物学领域的研究热点。本研究以哥伦比亚生态型拟南芥和解淀粉芽孢杆菌13-24菌株为实验材料,通过测定对照、菌株处理、高钙处理、高钙+菌株处理四种处理条件下拟南芥根部的各项生理生化指标,判定解淀粉芽孢杆菌处理能否提高拟南芥对高钙胁迫的抗性;通过对四种处理条件下
华为技术有限公司1987年成立之时只有6名员工和20000元注册资金,在既没技术又没资金的背景下,经过三十多年的发展最终成长为全球领先的ICT(信息与通信)基础设施和智能终端提
在大数据时代背景下,信息技术的发展与应用已经深入到我国社会生产与生活的各个行业与领域,且取得了较为优异的成绩。其中,大数据时代信息技术在我国城市规划设计中的应用范
随着网络技术的不断进步和相应商业模式的创新,21世纪以来,电子商务在全球经历了井喷式的增长。然而,在进行跨境电子商务业务的过程中,我国跨境电子商务经营者也面临许多知识
中药组分制剂是指以中药组分为基本单元,兼顾中药多成分多靶点起作用的整体性,并能明确物质基础的新型制剂。中药组分的生物药剂学性质是制剂处方优化与剂型设计的重要依据,