基于融合语义和CapsNet的图像识别方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhou1022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别指利用计算机对图像信息进行处理和分析,从而对图像中包含的目标类别进行划分。图像的识别具有非常广泛的应用,如指纹识别、人脸识别和交通标志识别等。现有的卷积神经网络图像识别方法,由于其具有强大的特征学习能力,在识别准确率上表现优异。但是,该类方法是基于数据驱动,存在样本需求量大,训练时间长,调参困难等缺陷。本论文主要研究并实现了一种融合语义和胶囊网络(Capsule Network,CapsNet)的图像识别方法。图像语义是指视觉接收图像信号形成的结构化知识描述,包含一系列可理解、可解释的信息。该方法通过融合图像的语义和CapsNet,提高训练数据的利用率,可在较少样本集训练的情况下,达到较好的识别效果。该方法可以有效缓解深度学习模型依赖大量训练样本的问题。具体工作内容如下:(1)本文提出一种基于语义的识别网络,模拟人对图像中不同类别目标的认知过程:依据不同类别的目标具有其特定的知识描述――语义,对目标进行分类识别。不同的语义之间具有一定的层级关系,图像中语义往往由若干子语义组成,子语义可以继续不断划分,直到不能拆解时称为语义基元,本文构建语义网络来描述语义基元与语义的关系,通过对语义基元的识别,以及特定语义中包含不同语义基元的组合规律,进而识别特定的目标。然而,由于语义可描述特征基于人类知识,对细节刻画能力有限,且自然环境下获取的图像存在遮挡、光照不足等各种不同程度的干扰,图像中可提取的语义特征有限,导致单独使用语义网络的识别效果不理想。本文又通过设计损失函数融合语义网络和胶囊网络,提高了数据的利用率,增强细节描述能力,使得在使用小样本数据训练的情况下,获得具有较好的识别性能,仿真实验结果验证了这一优势。(2)本文对Hinton提出的CapsNet中动态路由算法进行了分析与研究,设计了三种改进的算法:基于meanshift改进的动态路由算法、top-K路由算法、自适应学习聚类算法。本文就改进的算法,分别在MNIST数据集上进行了对比实验。实验结果表明三种算法都取得了优于动态路由算法三次迭代的识别效果。本文还进一步对其中效果最优的自适应学习聚类算法在CIFAR10和GTSRB上进行了仿真实验,实验结果表明本文改进后的自适应学习聚类算法,克服了动态路由算法计算复杂度高及网络扩展性差的问题,具有参数少、更广泛的适用性和可扩展性的优点。
其他文献
企业在新能源战略中如果不发展新能源战略带来的成本节约率ε1越高,其边际成本C1越低,新能源产品和传统产品的价格差异越大。随着消费者对每个环境满意度愿意支付的K值的增加
[目的]研究肺癌术后病人家庭生活质量与家庭支持之间的关系。[方法]采用问卷调查的方式,对75例肺癌术后病人的生活质量与不同家庭支持状况进行调查,并分析两者之间的相关性。
从祁连山高寒退化草地优势植被钝裂委陵菜根围分离丛枝菌根真菌(AMF),鉴定并研究其促生效果,为农业生产和生态修复提供服务。用湿筛倾析-蔗糖离心法提取土壤AMF孢子,按形态挑
总结了广州大学物理实验教学模式改革的思路及方案,实验教学体系建设,实验教学方法和手段,教学过程、内容和考核方式等实践过程中的经验和体会.阐述了实验课程定位与建设理念
自汶川地震发生以来,大量心理工作者积极热情地深入到灾区的学校进行灾后心理援助。爱心和热情无疑是宝贵的,但光有爱心和热情远远不够,对灾区学生的心理援助应当在科学、有
“零度写作”是罗兰·巴尔特在其著作《写作的零度》一书中提出的著名文艺观点。“零度写作”是指一种直陈式的白色写作,或者说是一种非语式写作、新闻式写作。法国新小说代
<正>中国已故外科学大家裘法祖先生曾这样形容医患关系,"医生治病,是把病人一个个背过河。"这个贴切的比喻很形象地展现了医生与患者之间腹背相亲、患难与共的关系。作为众多
2015年,笔者参加了深圳市记协与美国密苏里大学新闻学院联合举办的“媒体融合战略发展最新趋势深圳高级研修班”,了解到了一些美国媒体融合发展的新趋势、新理念、新潮流、新做
国外对航空化学灭火非常重视,这种灭火方式已成为森林灭火的主要手段,大多数的森林火灾都是采用飞机化学灭火与地面少数扑火人员配合的方式扑救。森林航空化学灭火飞机装备有
本文通过标准化短程预防用药的观察,对下颌阻生智齿拔除术后使用药物问题进行了探讨。作者认为下颌阻生智齿拔除术后应常规使用止痛药,但如无感染存在,则使用抗生素预防术后并发