可解释性多标签分类

来源 :天津大学 | 被引量 : 0次 | 上传用户:jackydmb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签分类旨在为单一样本预测一个标签集合,是机器学习中被广泛研究和重点关注的一类问题。多标签分类在真实世界有许多典型的应用,包括图像标注、用户画像、文本分类和音乐/电影分类等。尽管一些有效的算法已经被逐渐提出来,但不管是传统多标签分类算法还是深度多标签分类模型都缺乏较好的可解释性。此外,多标签分类仍然存在以下关键难点,即:如何有效减小庞大的标签输出空间、如何显式建模视觉特征与语义标签的对应关系和如何准确识别不同尺寸目标类等。为此,本文围绕可解释性多标签分类这一主题,并针对上述三大难点分别从显式的地标选择、显式而准确的标签相关深度特征和多尺度跨模态特征融合角度提出了三个可解释性的多标签分类模型。其中第一个模型是基于传统多标签算法并在图像、文本和音乐等多个数据域上验证其有效性,第二个模型和第三个模型则是基于深度学习框架并对输入图像构建一个端到端的多标签分类网络。本文所提出模型的主要贡献如下:1、基于易测地标的多标签分类,该模型基于地标选择的策略,通过构造两个关键性矩阵,即地标选择矩阵和标签相关性矩阵,从而将显式的地标选择、地标预测和全标签恢复联合构建成一个统一的框架,因此保证了选择的地标标签不仅具有代表性且本身容易被预测出来,增强了模型的可解释性。2、基于标签相关深度特征的多标签分类,该模型通过在图像视觉特征和标签语义嵌入之间学习多个标签相关的深度特征映射,从而在局部视觉区域和目标类别之间建立起显式的、准确的对应关系,提高了特征学习的有效性并且增强了模型的可解释性。此外,提出了两种变体图卷积网络来捕获标签之间复杂的依赖关系。3、基于多尺度跨模态特征融合的多标签分类,该模型针对现有方法无法准确识别较小尺寸目标类的问题,通过引入空间注意力模块并将图像多尺度特征与标签语义重嵌入进行跨模态融合,使得模型能更准确地定位和识别不同尺寸的目标类,增强了模型的鲁棒性和可解释性。
其他文献
<正>黄河上中游天然林保护修复实施已有多年,其生态效益价值如何?社会经济效益是何水平?在黄河流域生态保护和高质量发展目标中扮演何种角色?一直以来,这些问题都未有翔实的数据支撑。日前,国家林业和草原局发布《黄河上中游天然林保护修复效益监测国家报告》(以下简称《报告》),上述问题都有了答案。《报告》显示,天保工程实施后,黄河上中游天然林保护修复生态效益年总价值增加4943.88亿元,为保障黄河长治久安
期刊
综述神经溃变和再生机制的研究进展。当神经纤维或神经元胞体受到损伤等刺激性伤害时,远侧断端会发生一系列组织学退行性改变,发生溃变;受损的神经元轴突生长,并与溃变前的组织或神经元重新形成突触结构,恢复正常生理功能,进行再生。神经溃变可分为顺行性溃变(又称为Wallerian变性)、逆行性溃变、跨神经元性溃变,近年来对Wallerian变性的研究较多。巨噬细胞、无菌α和Toll白介素受体基序蛋白1(SA
期刊
真核细胞包含许多组成部分,被称为亚细胞区室或细胞器。蛋白质必须被运输到适当的亚细胞区室才能正常发挥其分子功能。蛋白质组学分析的一项基本任务是探索蛋白质在亚细胞水平上进行活动和调节活动的功能。细胞的分隔可以使蛋白质有效地发挥其活性。蛋白质只有在正确的位置,正确的时间出现,并与正确的分子相互作用,细胞的生命活动才能正常运行。蛋白质亚细胞定位的知识可以为了解蛋白质功能和相关细胞机制提供有价值的见解。因而
学位
生物信息学是研究生物信息的采集、处理、存储、传播,分析和解释等方面的学科,它通过结合生物学、计算机科学、信息工程、数学和统计学对生物数据进行分析和解释,是一门交叉学科。生物信息学的研究方向包括基因组学和蛋白质组学等,通过算法来分析和理解核酸序列和蛋白质序列中的组织原理,揭示巨量生物信息数据中所蕴含的生物学奥秘。深度学习是机器学习领域中一个新的研究方向,其灵感来自于人脑过滤信息的方式。深度学习存在很
学位
针对炮位侦察校射雷达在弹丸上升段长时间预测落点偏差大的问题,文中提出了一种基于长短时记忆(LSTM)网络的弹丸长时间落点预测模型修正算法。针对训练样本少的问题,采用知识驱动和数据驱动相结合的双驱动方法,结合传统无迹卡尔曼滤波预测作为先验知识,利用LSTM网络对射向和侧向偏差量进行学习拟合构建误差模型,并利用误差模型对外推弹道进行射向和侧向修正。仿真验证表明:采用少量训练样本就可显著提升弹丸长时间落
期刊
生物信息学的研究重点主要体现在基因组学和蛋白质学两方面,具体地说就是从核酸和蛋白质序列出发,分析序列中表达结构和功能的生物信息.生物信息学的基本任务是对各种生物分析序列进行分析。这里我们依据蛋白质氨基酸序列研究三型分泌系统效应蛋白的分类研究,以及根据m RNA序列研究亚细胞定位。Ⅲ型分泌系统(T3SS)可以在许多致病细菌中发现,例如痢疾杆菌,鼠伤寒沙门氏菌,霍乱弧菌和致病性大肠杆菌。这些细菌的感染
学位
报纸
熵搜索及其派生方法是一类贝叶斯优化方法,其可实现黑盒函数的主动探索。它们最大程度地增加了有关黑盒函数获得全局最优的输入空间位置的信息增益。然而,现有的熵搜索方法遭受由高维优化问题引起的困扰。一方面,用于估计熵的计算随着维数的增加而呈指数增长,这限制了熵搜索对高维问题的适用性。另一方面,许多高维问题的性质是大量维度数对目标函数的影响很小,但是目前没有压缩机制来排除这些多余维数。在本文中,提出了一种新
学位
目的 探究绿原酸(Chlorogenic acid,CGA)对粪肠球菌(Enterococcus faecalis,E.faecalis)诱导的高血压模型小鼠降压和肾脏保护作用。方法 将20只6~8周龄C57BL/6小鼠随机分为对照组、粪肠球菌组、绿原酸组和粪肠球菌+绿原酸组。给小鼠灌胃10~9CFU粪肠球菌或100 mg·kg-1绿原酸溶液8周,期间使用尾套法测量血压,取材前使用代谢笼收集尿
期刊
4G网络的广泛普及推动了移动终端的快速发展。安卓(Android)作为占据全球市场份额最多的移动端操作系统,其安全性广受学术界和产业界的关注。由于安卓系统具有开放和易移植的特点,导致移动应用市场中充斥大量恶意软件。这些恶意软件不仅影响用户使用体验,而且极大地危害了用户的身心健康和财产安全。随着恶意软件开发者技术更新迭代,当前的检测方法不能很好满足高效精准的检测需求。其具体表现在检测特征和分类器单一
学位