【摘 要】
:
智能零售店已经成为吸引许多科技公司的关注的活跃话题。亚马逊、深兰科技奥兰治和IBM等公司已经开始通过搭建完整的智能零售店或零售柜来提高客户的购物体验。这些公司正在使用较为复杂的集成系统来实现其目标。但是,在考虑具体搭建一个小规模的智能零售店场景或零售柜时,首先需要解决一些关键问题:如何生成和标记属于某个域的所需图像数据集,比如,拟售商品在不同视角下的拍照图像;设计用于所售商品检测识别机器学习轻量化
论文部分内容阅读
智能零售店已经成为吸引许多科技公司的关注的活跃话题。亚马逊、深兰科技奥兰治和IBM等公司已经开始通过搭建完整的智能零售店或零售柜来提高客户的购物体验。这些公司正在使用较为复杂的集成系统来实现其目标。但是,在考虑具体搭建一个小规模的智能零售店场景或零售柜时,首先需要解决一些关键问题:如何生成和标记属于某个域的所需图像数据集,比如,拟售商品在不同视角下的拍照图像;设计用于所售商品检测识别机器学习轻量化模型,它要同时满足精度、速度和存储容量等多个方面的要求;设计基于客户人脸图像的年龄估计和性别识别的轻量化机器学习模型。本文在较为全面地整理归纳智能零售店和零售柜的基础上,提出了一款智能零售柜总体设计方案,并就其中的三个关键问题,进行较为深入的研究,提出并实现了相应的解决方案。为了生成用于深度学习训练的带标注的图像数据集,本文设计了一条简单高效的人机协同的处理流水线。首先,对于每一类拟出售的商品,通过人工拍照或其它渠道,采集得到包含有该商品的图像,并赋予商品的类标属性,形成初步的图像数据集。随后,从每类商品中随机选择小部分图像,采用预训练的Mask RCNN模型,生成可疑目标的边界外框,经过人工验证,分拣出正确目标,并把硬误检目标和背景目标都归类为背景。据此分拣数据,采用VGG16提取特征,训练出一个目标分类器备用。然后,对于初始图像数据集中的每张图像,再次使用预训练的Mask RCNN提取可疑目标及其边框坐标,采用VGG16提取特征,使用上述中训练过的目标分类器,生成可疑目标的类标。最后,再经过人工审核确认,选出那些边框坐标和类标都正确的目标,组织成标准格式的带标注的图像数据集。该标注流水线可有效降低标注的人工成本和时间成本。使用轻量级深度学习模型对商品图像进行目标检测识别是本文的另一个重点工作。本文在采用基于CNN模型的单阶段目标检测算法处理流程的基础上,引入了一种自定义模块,它有助于减少CNN模型的参数数量,同时保持模型的原始精度。这种方法具有一定的通用性,通过在原始深度学习模型中进行一些小的更改,可以将设计的自定义模块插入到原始模型中。设计自定义模块的主要思想是通过减少模型参数的数量,从而降低保存模型权重的计算成本和存储容量,同时保持原始模型所保持的精度。本文设计的自定义模块在YOLO模型中将参数数量减少了 41.77%。本文设计了一个轻量级模型架构从客户图像中检测出人脸目标并估计出客户的年龄和性别。通过把原来相互独立的年龄估计模块和性别识别模块进行适当的更改,设计出一个能对年龄和性别同时进行估计的轻量级模型,降低了模型的容量和检测时间。年龄和性别的估计结果,将用于实现在未来版本中的产品推荐功能。本文的主要创新点是:(1)一种简单有效的图像数据库构建与边框标注的智能处理流水线及其核心算法;(2)引入自定义模块到目标检测的深度学习模型中,在保持原始模型精度的同时减少模型的参数数量。(3)构造了一个有效的轻量级CNN模型,用于从客户的面部图像中同时估计出客户的年龄和性别。
其他文献
目的:本实验通过研究胡蜂粗毒及其分段提取物对肿瘤坏死因子TNF-α诱导的类风湿性关节炎成纤维滑膜细胞MH7A凋亡和炎症的影响,进一步探讨抑制MH7A细胞增殖和炎症作用最佳的胡蜂毒提取物,并初步探究其诱导MH7A细胞凋亡和降低炎症反应可能的作用机制。方法:本实验通过TNF-α诱导MH7A细胞发生炎症反应并有过度增殖现象,造成RA模型。造模成功后,将胡蜂粗毒、<3 k Da胡蜂毒、3~10 k
扣件式钢管满堂支撑体系具有装拆方便、承载力高、通用性强等优点,在各种支撑体系中占主导地位。但在实际工程中满堂支撑体系倒塌事故屡有发生,这主要是由于对施工期钢筋混凝
本研究以裂盖马鞍菌作为研究对象,对其含有的主要营养成分多糖、总黄酮、脂肪酸、微量元素及重金属等进行分离和定量研究。同时,采用动物急性毒性和重复给药毒性研究的方法评
近年提倡全民创业、促进民营企业发展的多项政策给担保公司带来新的发展机遇。但是由于经济下行、宏观经济不景气导致中小微企业盈利能力下降,担保公司贷款担保的代偿水平显著上升,有数据显示2017年我国担保行业代偿率超过2%,代偿发生导致担保责任拨备覆盖率大幅下滑。伴随着中国经济步入新常态,中小微企业经营难度增加,新常态对企业主提出了更高的经营管理要求,也对担保公司风险管理提出更高的要求。担保公司需要适应新
城市道路网是交通系统的重要组成部分,也是居民生活不可或缺的基础设施。面对城市路网结构的快速变化以及交通拥堵等城市问题,如何快速准确地更新道路地理信息数据,保持现势性与精确性已成为一个重要的研究课题。车辆轨迹可以直接反映道路网的特征,并具有易于获取、采集成本低、覆盖范围广、现势性强等优势。在大数据的时代背景下,相较于传统测绘手段获得的路网信息与借助遥感影像的道路提取方法,以车辆轨迹数据为数据源,以时
目的:研究益气化瘀补肾方对气虚血瘀肾亏型颈椎病的作用机理。方法:选择3月龄雌性 SPF 级 SD 大鼠30只,随机分为正常组、气虚血瘀。肾亏型颈椎病模型组和治疗组,每组10只。正
维生素D受体(VDR)为核转录因子,在组织中广泛表达,通过与启动子结合调控基因转录。课题组前期发现VDR敲除小鼠生殖能力显著下降,推测VDR可能调控激素合成和生殖发育相关基因的表达,进而影响雄性生殖性能。本研究基于WT和VDR-/-小鼠睾丸组织蛋白组分析数据,发现VDR敲除后HSD3B1表达显著降低。HSD3B1是负责多种组织中雄激素、孕激素和糖皮质激素等激素中间类固醇生成反应的酶,因此,揭示VD
颈椎病是临床常见的难治性疾病之一。当前的治疗方法主要有卧床休息、手法按摩颈牵引、服用止痛剂和肌松剂、硬脊膜外腔激素注射[1]等方法,但仅能缓解和改善症状,且病情易反
目的:研究益气化瘀补肾方对气虚血瘀肾亏型颈椎病的作用机理。方法:选择3月龄雌性SPF级SD大鼠30只,随机分为正常组、气虚血瘀肾亏型颈椎病模型组和治疗组,每组10只。正常组不
The present thesis is devoted to the use of microfluidic techniques for the detection of target molecules.The defender of this thesis believes that the implemen