【摘 要】
:
在众多计算机视觉任务解决方法和工具中,卷积神经网络(CNN,Convolutional Neural Network)被广泛运用到图像分类、目标识别等领域,其作为图像特征提取器可以取得很好的处理效果。但由于CNN需要大量的图像来支持训练,且一般CNN使用池化层对特征进行降维操作,造成信息损失,影响网络表达能力。胶囊网络(Caps Net)是近年来计算机视觉领域颇具革命性的神经网络模型,与CNN不同
论文部分内容阅读
在众多计算机视觉任务解决方法和工具中,卷积神经网络(CNN,Convolutional Neural Network)被广泛运用到图像分类、目标识别等领域,其作为图像特征提取器可以取得很好的处理效果。但由于CNN需要大量的图像来支持训练,且一般CNN使用池化层对特征进行降维操作,造成信息损失,影响网络表达能力。胶囊网络(Caps Net)是近年来计算机视觉领域颇具革命性的神经网络模型,与CNN不同,Caps Net使用向量输入输出保留图像空间信息,使用动态路由机制使模型具备更好的特征拟合能力。但在某些特定场景及具体应用中,仍需要对Caps Net结构进行优化以取得更好的效果。本文首先对场景识别研究的背景和重要意义进行了介绍,并且对国内外场景识别中所使用的主要方法进行深入了解。在介绍胶囊网络原理的基础上,提出了适用于场景识别任务的Scene Caps模型。以胶囊网络为基础,增加了卷积层_2,搭建了五层的Scene Caps网络模型,增加了模型的深度,并且将胶囊中的维度进行了扩维。实验分析了卷积层_2学习率和卷积核大小的不同对识别率和训练时间的影响,在Scene15数据集进行的实验结果显示,Scene Caps模型的最高识别率达到94.82%,用时为37.2h,比胶囊网络模型的识别率提高了0.28%,训练时间减少了11.8%;分析了模型参数和训练数据量的变化对实验结果的影响,实验结果表明Scene Caps模型使用50%的训练数据量就能达到胶囊网络75%数据量的识别率;与常用的场景识别方法进行了对比,实验结果表明Scene Caps模型对场景图像的识别效果更好;最后在place2部分数据集上进行了实验,实验结果验证了模型的有效性。提出了一种基于1*1卷积核和批量归一化的优化方法。将1*1卷积核加入卷积层_2,降低模型的卷积层参数数量,增加模型的非线性特性。在Scene15数据集上进行的实验表明,模型的识别率最高为94.83%,训练时间为32.2h,比未加入1*1卷积核的识别率提高了0.01%,训练时间减少了13.4%。为了使网络输入分布保持一致,再将批量归一化层分别应用在卷积层1、卷积层_2、Primary Caps层前,然后再做为激活函数的输入。通过对Scene Caps模型的优化,识别率由优化前最高的94.82%提升为优化后最高的95.03%,训练时间由37.2h的降低为20.1h。实验结果验证了优化方法的有效性。本文主要的创新点在于首次提出基于Scene Caps模型的场景识别研究方法和基于1*1卷积核和批量归一化的优化方法,有效提高了场景图像识别精度,并降低了模型训练时间。
其他文献
法拉第波(Faraday wave,FW)声学生物组装技术属于声学生物组装技术中的新型组装技术。相较于体超声波生物组装技术和表面超声波生物组装技术,法拉第波生物组装技术具有其独特的特点:(1)法拉第波生物组装技术拥有更广的组装对象范围,既可以对漂浮于气-液界面的微粒进行生物组装,又可以对沉淀在组装腔室底部的微粒进行生物组装。(2)法拉第波生物组装技术拥有更多的组装样式,法拉第波生物组装过程中在液体
近些年,钙钛矿太阳能电池经历了突飞猛进地发展,其光电转换效率从2009年的3%一路提升到2020年的25%,彰显着它作为目前最热光电材料的地位。尽管钙钛矿电池取得了如此多的成就,在光、热、水汽条件下的不稳定性却是它迈向商业化途径中的最大障碍。其不稳定的主要原因有如下几点:第一,由于钙钛矿材料中易挥发和分解的有机阳离子的存在使钙钛矿材料自身不稳定;第二,界面间缺陷导致的不稳定性。针对这些问题,本论文
在污水处理厂中由于搅拌不均匀、池型结构、短流等原因导致水力混合条件恶化的情况时有发生,但由于尚未找到一种快捷、有效地方法监测水力混合条件的变化,因此一般污水厂很少对其混合条件进行监测。随着图像获取设备的普及尤其是智能手机设备的大量使用,图像信息获取成本急剧下降,因此将图像颜色信息应用于污水处理厂有着良好的应用前景。在此基础上本课题以四种不同操作条件的活性污泥以及厌氧氨氧化污泥为研究对象,探索并总结
由天然丰富的元素组成的有机电极材料具有资源可持续、氧化还原性质可调、环境友好等优点,成为下一代绿色电池极具潜力的电极材料。p型有机电极材料具有阴离子掺杂/脱杂机理和较高的氧化还原电位,是构成双离子电池的重要正极材料。导电聚合物和氮氧自由基聚合物是最典型的p型有机正极材料。近年来,研究人员的兴趣也转向基于各种电活性芳杂环的聚合物,包括N-取代吩嗪、吩噻嗪、吩恶嗪和噻蒽。这些芳杂环单元具有能进行两电子
碳纳米管独特的管状结构、高的比表面积,使其具有良好的吸附性能。然而,由于碳纳米管在水溶液中的团聚,使其在废水处理中的应用受到限制。此外,吸附后从溶液中回收游离碳纳米管仍然是一大难题。因此,通常采用在载体材料表面生长碳纳米管来解决这一问题。本论文采用化学气相沉积法(CVD)研究碳纳米管在粉煤灰空心微珠表面的生长,获得具有高密度缺陷的碳纳米管(粉煤灰空心微珠@碳纳米管)。首先,对粉煤灰空心微珠理化性能
饮用水中细菌超标,会导致人体产生各种疾病,对人体造成极大的危害,因此,灭菌是饮用水处理过程中必不可少的环节。部分自来水厂深度处理能力不足、供水管道过长等问题可能导致灭菌的生长和繁殖,因此有些家庭选择使用净水设备来再次处理自来水,以达到杀灭所有细菌的目的。目前家庭常用的纯净水设备一般包括三个常用的水处理装置,分别是一个PP棉过滤装置和两个活性炭吸附装置,更高级的处理则包括软化装置、反渗透装置、纳滤膜
网络时代中的媒介表现手段愈发丰富和精确,诸如疫情等重大公共卫生事件的发生往往会对公众造成身心健康影响。在大面积蔓延的新型冠状病毒疫情中,社会情绪的生成与交流方式逐渐转化为以家庭局限空间向个体ID聚集下的网络空间的延伸,个体情绪脆弱、敏感的特性,会在特定社会事件的刺激下转化为非理性化的群体情绪。一方面,情绪本身的客观性存在为网络空间舆论治理研究提出了新的挑战,使传播学在新媒体领域中的研究更加纷繁充盈
传统舰船图像灰度校正方法,存在高动态复杂光照条件下,图像动态差,计算精度降低,图像灰度区域系数修正量异常,无法准确校正高动态区域图像灰度系数的问题。因此,基于复杂光照条件特征,提出复杂光照条件下舰船图像灰度校正方法研究。首先对复杂光照图像的高动态区域进行灰度差分计算,划分需要灰度校正的复杂光照区域;接着,对复杂光照图像区域的灰度进行高动态灰度系数模型计算,得到灰度优化系数;最后通过模型优化量替换计