基于深度学习的多标签场景图像分类研究

来源 :西安石油大学 | 被引量 : 0次 | 上传用户:yangyuwu21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景分类是图像分类的一种特殊情况,它根据图像的视觉内容为图像赋予相应的语义类别,相对于一般的图像分类,场景分类训练的数据集可能较小,且场景分类往往是多标签的,同时类内差异明显,类间又有很多相似性,使得多标签场景图像的有效分类存在诸多挑战。深度学习在识别图像中的对象方面具有非常优异的表现,基于深度学习的图像分类在特定任务上早就超过了人类的平均水平。本文利用深度学习相关神经网络算法良好的特征提取优势,结合多示例多标记学习(MIML)和迁移学习相关理论建立分类模型,给定一组图像,识别图像中包含的场景或对象来对它们进行多标签分类。基于深度神经网络的多示例多标记学习算法,将BP神经网络和RBF神经网络引入到多示例多标记学习框架中,分别建立MIMLNN算法和MIMLRBF算法的分类模型,能够采用非线性函数为标签相关性建模,描述出更为复杂的标签同现关系,同时将标签的相关性反馈到输入来提高系统的性能。与传统的MIML相关算法相比分类效果优势明显,同时通过改进MIMLRBF算法中Hausdorff距离表达,提出改进的W-MIMLRBF算法,进一步提高多标签场景图像分类效果。基于迁移学习的多标签场景图像分类算法,消耗少量的计算资源与训练时间即可实现场景图像的有效分类。在计算机视觉任务中运用深度学习技术,将已训练的模型作为新模型的起点是一种常用的方法。本文基于已经训练好的Inception-V3网络模型,在其基础上进行参数与知识迁移,保留Inception-V3模型用于图像特征提取的卷积层,修改其全连接层以满足多标签分类输出要求,基于迁移学习训练出的分类模型可以有效地提取出图像的本质特征,在多标签分类评价标准上取得了优异结果。
其他文献
患者男,49岁。发热、乏力2个月,全身出现散在红斑、毛囊性丘疹1个月。实验室检查:CD4/CD8:0.19;血浆快速反应素试验(RPR)1∶4(+),梅毒螺旋体颗粒凝集试验(TPPA)(+);HIV抗体(+
根据协同学的序参量原理和役使原理,建立产品创新与工艺创新协同发展的协调度模型,采用2000-2008年制造业企业科技活动的面板数据,对制造业企业产品创新与工艺创新协同发展进
近年来,我国政府采购占全球份额已超过10%,交易规模也在不断扩大,但统一的电子化交易平台的缺失使得采购过程较为分散,供应商存在着诚信缺失等问题,使得采购效率大大降低,扰
石灰石砂在大型铸钢件上的应用太原重型机器厂董必义,杨林魁0引言石灰石砂七十年代应用于铸钢件的生产,具有很多优点。石灰石矿在我国分布极广。贮藏量大,资源丰富,价格低廉,各个厂
中国古人对生活的理解大致是两个层次,一是活命需求;一是体认天理。从形下到形上,由器物直悟天道。在这种文化形态中,日用器物不仅是消费品,也是非文本的伦理教本,致使生活方
系统仿真类课程已成为自动化及相关专业的骨干课程,在理论和实验教学、科学研究和生产实践中都发挥着不可替代的重要作用。课程建设和学生专业能力培养需要精心设置和规划相
随着世界各国档案专家对档案服务与互联网络关系认识的深入 ,越来越多的档案馆在INTERNET上建立了自己的网站 ,“迄今为止 ,已有2000多个档案馆开通了自己的主页。”①以下是
<正>一、考点词汇选析1.proud proud,自豪的;得意的;光荣的;高尚的;傲慢的;有自尊心的比较级:prouder,最高级:proudest常见搭配有:be proud of...=take pride in...因为……