基于视觉混淆特性的图像分类算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:kkrriikk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,图像分类算法发展迅猛、成果显著,尤其是以基于深度学习的图像分类算法更是取得了比肩人类的性能。但是该领域的发展仍存在以下两大挑战。首先,虽然基于深度学习的图像分类算法性能较好,但是目前主流的这些算法并没有充分地利用视觉混淆性这样的先验信息;其次,深度学习模型的体积和计算量都非常庞大而难以满足对功耗和容量都有限制的端设备的实时应用需求。本文针对图像分类算法所面临的两个挑战,引入图像中普遍存在的视觉混淆特性开展研究。首先,为了刻画图像的视觉混淆特性,我们为图像数据集建立了“视觉混淆树”的树形结构,通过“视觉混淆树”的可以将图像数据集中每个类别按照层次结构归为不同粒度的类别集合,从而反映了不同的混淆程度。其次,在视觉混淆标签树的基础上,建立了标签树形分类器以及带回溯的标签树形分类器,将视觉混淆树与传统机器学习方法结合起来增加图像分类的精度;同时也将视觉混淆树的结构嵌入到深度模型中以增强图像分类的性能。当视觉混淆标签树建立完毕,就可以用这个树形分类器替换深度模型中计算量非常大的全连接层,这样就可以增强深度模型图像分类算法的实时性。我们在实验中首先验证了我们的标签树分类器相对于目前性能最好的标签树分类器有了显著地提升,在CIFAR-100和ILSVRC12两个数据集的Top-1精度分别提升了4.3%和2.4%。另外,在精度不受损失的情况下,我们的方法相比于带全连接层的AlexNet和VGG16模型分别有了124倍和115倍的加速比的速度提升。然后又通过实验验证了我们可回溯标签树分类器算法的有效性,在CIFAR-100数据集上进行了实验,实验结果表明,利用不同深度学习模型提取的特征,我们的可回溯标签树分类器都比不带回溯功能的标签树分类器的精度高。最后我们通过对提出的视觉树卷积神经网络和基准卷积神经网络进行对比实验,验证了我们提出的方法的优势。在实验中,我们构建了3个不同的视觉树卷积神经网络模型,我们发现与对应的基准深度卷积神经网络相比,这3个视觉树卷积神经网络模型在精度上分别有1.36%、0.89%和0.64%的提升。
其他文献
现如今,软件的数量和代码量呈爆炸式增长,随之而产生的安全性问题也引起越来越多的关注。程序员的一个不经意的小错误可能会引发严重的后果,影响到软件运行的稳定性和用户使
摘 要:推进村级党组织领导法治化是实现乡村治理体系和治理能力现代化的必然要求,是在乡村治理中实现党的领导、人民当家作主和依法治国有机统一的根本途径,对于坚持和加强村级黨组织领导,保证村民自治的有效运行,推进法治乡村建设具有重要意义。在村民自治背景下推进村级党组织领导法治化需要着力解决以下关键问题:完善村级民主决策的法律机制,通过合法途径将村级党组织的意志上升为村庄的公共意志;全面贯彻落实党管干部原
飞机装配是产品生命周期中的重要环节,与产品性能、质量等因素密切相关。目前,飞机装配工艺设计大多以二维图纸为依据,其方法可视化效果差,而应用三维模型可以形象的、直观的
在计算机视觉、模式识别与机器学习领域中图像场景分类扮演着非常重要的角色。图像场景分类广泛应用于很多个领域,如目标识别和行为检测。但是,对于单个物体实例来说,通常会
探索与利用的均衡一直是强化学习研究的重点之一。探索帮助智能体进一步了解环境来做出更优决策;而利用帮助智能体根据其当前对于环境的认知来做出当前最优决策。强化学习通
石油产品自20世纪初就成为了工业生产的重要原料,由于泄露、偷排、意外事故等原因,它们进入环境造成污染并严重地威胁着人类健康。这些难溶于水有机液态污染物进入地下环境后
近年来,随着社会老龄化加剧及经济下行的压力加大,医保基金收入逐步放缓。与此同时,国家医保制度在不断完善,医保参保范围逐步扩大,医疗需求得到大量释放,使得医保基金支出增
机器学习方法是一种时下相当热门的方法,它在计算机视觉,自然语言处理,数据挖掘,自动驾驶等等领域取得了巨大的成果。当下,由于某类机器学习方法的激活函数与传统有限元方法
铁路在我国交通体系中一直处于骨干地位,是连接各大经济区域之间、城乡之间交通与经济的运输大动脉。铁路对地方经济社会发展起着保障性的基础作用,也是未来持续发展的强大动
作为一种重要的优化方法,进化算法以其实现简易、效果突出等优点在许多单目标连续优化问题上得到了广泛应用。然而,没有免费午餐定理(No Free Lunch Theorem)揭示了优化算法