基于卷积神经网络和集成学习的图像识别模型

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:w3cnet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年是互联网飞速发展的时期,越来越多的人们在网上浏览新闻、进行社交等等,这为图像信息的传递提供了非常方便的媒介。图像数据简单直观,包含了丰富的信息,作为信息交换的载体被广泛应用,因而图像识别任务近年来成为了科学家们的研究热点之一。目前的图像识别算法主要包括传统和新型两种类别,其中传统的图像识别算法以图像为基础进行处理,新型的是以人工智能为基础的。传统的算法需要专业的知识、精心的设计来进行特征提取,比如LBP、Ho G、SIFT等,而且花费时间长,不能实现实时的处理,准确率也不能保证。但是基于人工智能的新型图像识别算法相对于传统算法来说更加简单而且速度快,比如说近几年的研究热点——卷积神经网络,它可以通过半监督甚至是无监督的方式自行提取图像的特征,与手动提取相比,这种方式能够更精准的提取到重要的特征,从而提升模型的准确率。但是,卷积神经网络往往需要训练数千万甚至数亿的参数才能完成对新目标的预测,除了需要较长的训练时间外,还可能因数据量不足而导致过拟合。因此本文重点研究如何在小数据集上应用卷积神经网络来快速准确的完成图像识别任务,提出了一种基于卷积神经网络、利用迁移学习和集成学习搭建的复杂度低、识别准确度高并且效率高效的图像识别模型。本文的主要研究成果如下:1)针对卷积神经网络的结构,分析其在进行图像识别任务时每一层的功能和效率,发现了它在特征提取方面的独特优势以及它训练时间过长的原因之——全连接层参数众多。综上,将卷积神经网络作为一个特征提取器,仅进行对图像的特征提取,并替换掉最后一层全连接层。本文将Inception-v3模型迁移过来可以在八分钟之内完成特征提取。2)将卷积神经网络提取到的图像特征作为传统学习器的输入可以显著的提升模型的准确率,本文中利用Inception-v3进行特征提取,然后分别作为支持向量机、逻辑斯蒂回归和k近邻的输入,通过这种方式搭建的模型,其rank-5准确率分别是99.02%、95.83%以及99.26%。3)利用集成学习将三个模型进行集成,进一步提升了模型的准确率。最终模型的rank-1准确率为96.32%,rank-5准确率为99.51%。
其他文献
肿瘤已经成为威胁人类生命健康的主要杀手。目前在临床上对于早期肿瘤的诊断还没有有效的方法和措施,从而导致病情出现症状时已经是中晚期或者晚期阶段。传统的治疗肿瘤的方
现如今计算机软件和人们的生活是密不可分的,保证软件的质量是人们首要关注的问题。软件测试是保证软件质量的重要手段,程序调试则是软件测试中比较困难的任务,而错误定位是
随着集成电路的发展,单块芯片上集成的核心数量越来越多,处理器进入众核时代。和传统的总线互联相比,高带宽、扩展性好的片上网络得到越来越广泛的应用。作为衡量片上网络性
随着社会与经济的不断进步发展,人们对于自身的保健越来越重视,着眼于国内的保健行业,短短的十几年内,需求不断扩大,市场迅速拓展,成为一项潜力无限的朝阳产业。此外,市场竞
随着科学研究的快速发展和学术成果的不断涌现,学术大数据逐渐形成。近年来,学术大数据引起了学者的广泛关注。虽然学者从多个角度对学术大数据展开了科学研究,但是在借助学
线性调频连续波激光测距具有测距范围大、精度高、分辨率高等优点,在大尺寸工业测量及激光雷达探测等方面得到了广泛的应用。线性调频连续波激光测距系统的关键在于如何获得
研究背景:随着科技的不断发展,社会的不断进步,人们生活节奏的越来越快,进而出现各种原因造成脊髓损伤(Spinal Cord Injury,SCI)的发病率越来越高。SCI是一种中枢神经上的严
数字微流控芯片是一种新兴的微流控技术,具有微型化、自动化、低成本和高效率的特点,能有效加快生化检测和分析的进行。因此,该技术在临床诊断、环境监测和药物制备等领域具
随着第4代移动通信网络(4th Generation Mobile Networks,4G)的商用化,研究者们开始关注能够应对未来第5代移动通信网络(5th Generation Mobile Networks,5G)中高可靠性,高传
持有移动设备的用户产生的位置数据,对于群智感知应用,如城市规划,智能传输系统等具有极大的价值。但是,用户上传位置数据,会引起隐私泄漏问题。传统的隐私保护模型,如k-匿名