【摘 要】
:
在多标签问题中,对标签的预测可能是不准确的、标签间相关关系可能是非对称的,这会导致多标签学习产生标签语义信息丢失、标签语义考虑不充分等问题。传统的多标签分类算法通过相同的属性集合预测所有标签,但在多标签分类的实践中,标签可能会拥有特定的属性特征,类属属性作为一种基于原始特征空间和对应标签的嵌入方法,有效地降低了多标签学习的复杂性。同时在标签空间进行标签间相关信息挖掘所获取的语义信息,可以有效提升多
论文部分内容阅读
在多标签问题中,对标签的预测可能是不准确的、标签间相关关系可能是非对称的,这会导致多标签学习产生标签语义信息丢失、标签语义考虑不充分等问题。传统的多标签分类算法通过相同的属性集合预测所有标签,但在多标签分类的实践中,标签可能会拥有特定的属性特征,类属属性作为一种基于原始特征空间和对应标签的嵌入方法,有效地降低了多标签学习的复杂性。同时在标签空间进行标签间相关信息挖掘所获取的语义信息,可以有效提升多标签类属属性学习性能,提高多标签分类精度。基于此,本文的主要研究内容如下:1)目前多标签类属属性学习主要采用基于嵌入的研究方法,存在标签语义考虑不充分、所选特征过于稀疏等问题,导致多标签分类性能欠佳。在语义网络和数据源的快速发展下,我们发现数字标签相对逻辑标签承载更多的语义信息,可以更全面地描述实例。首先利用相似实例之间互相可以进行线性表示的特点构建标签传播依赖矩阵,并通过标签传播依赖矩阵将原有标签空间的稀疏二进制矩阵构造为数字标签矩阵,以此获取更具鉴别性的标签来重塑原标签空间;其次在重塑过程中添加传播约束避免重塑前后标签矩阵可能存在的差异性,采用交替迭代的方法得到数字标签向量;最后使用余弦相似度构建重塑标签相关性矩阵约束解空间,对比度量类属属性学习能力是否得到提升。基于此,本文提出语义丰富的多标签空间重塑类属属性学习(Multi-Label Space Reshape for Semantic-rich Label-Specific Features Learning,LSR-LSF)算法。2)现有多标签分类模型多数采用距离度量或特征稀疏化策略提取类属属性,并通过余弦相似度方法构建标签相关性矩阵直接加入到模型中,进而挖掘标签空间的潜在语义信息。该过程忽略了标签间相关关系存在的因果性情况。单纯基于距离或稀疏化权重矩阵方法考虑标签独有特征,存在距离度量失效及特征稀疏化参数人工依赖问题,导致分类器性能欠佳。同时考虑到上述使用逻辑标签存在不能描述不同标签重要程度及无法充分表示语义信息等问题,我们在标签传播重塑标签空间丰富标签语义的基础上,结合条件独立性检验方法构造标签共现矩阵,并与标签相关性矩阵相结合构造标签因果相关性矩阵从而对得到的数字标签矩阵进行多标签分类学习。基于此,本文提出因果相关空间重塑的多标签分类(Causal Correlation Space Reshape for Multi-label Classification,CCSRMC)方法。3)在目前的多标签图像识别实践中,依然存在着数据量庞大、人工标注成本过高等现实问题。捕捉标签间存在的一些依赖关系,可以实现更快更精准的图像标注识别。本文将用于图像分类的GCN模型与标签传播依赖的空间重塑方法相结合,提取出图像的高级语义特征,实现了图像标签语义的扩充。在一定程度上解决了图像识别不精准,人工标注困难问题,提升了多标签图像分类精度。本文通过标签空间重塑来丰富标签语义进行稀疏多标签学习,在此基础上提取多标签类属属性优化多标签分类。通过标签传播方法解决原始空间存在的标签语义考虑不充分,所选类属特征过稀疏问题。通过因果推断方法解决标签间相关关系存在的不对称性情况。通过将图像分类的GCN模型与LSR-LSF算法相结合,提升了多标签图像识别精度。
其他文献
随着机器学习在人工智能领域中的不断发展,传统的单标签学习已经不能满足现实中错综复杂的数据需求,因此可以同时处理多目标及其分类任务的多标签学习逐渐成为相关领域中的重要研究方向。当下正处于信息流量爆发性增长的5G时代,数据特征普遍呈现高维复杂的特点。在多标签学习过程中,常使用特征选择来解决数据特征空间的高维性问题。信息熵由于具有不需要依靠假设已知数据分布就能有效度量变量之间非线性关系的特点,其计算得出
虫害一直是影响农作物产量和质量的因素。如何对害虫实施快速、准确并且及时地识别是虫情监控的关键一环,这对农业生产有着相当重要的影响。目前,对于害虫的识别可以分为两类。一种是依靠具有过硬专业水平的农业害虫专家通过观察害虫的外貌、习性等特征来进行判断。但是这种操作非常依赖于专家的经验,在一定程度上容易出现识别错误的情况并且存在费时、费力等问题。还有一种是依靠计算机对害虫进行识别。近年来,国内外许多研究者
在实际的控制系统中,如电力系统、通信系统、网络传输系统、机械控制系统以及工业系统等等,都广泛存在非线性不确定性和时滞问题,这两类问题的出现会使得控制系统的性能及稳定性受到影响。因此,针对非线性时滞控制系统,其研究具有一定的意义。除此之外,针对一类不确定非线性系统,其有关周期时变扰动的研究也是一个具有挑战性的问题,有关这一领域的研究成果也非常有限。鉴于此,本文针对两类具有周期扰动和输入时滞的不确定非
在临床医学中,医学图像作为一种辅助工具,对患者病情的判断以及手术方案的制定,起着至关重要的作用。然而,医学图像不同于自然图像,它具有较高的复杂性。设计出一种快速、精准的医学图像分割算法是具有挑战性的任务。针对以上挑战,解决了两个问题:(1)目标与背景极度相似,区分度低问题。(2)目标与目标之间边界不易区分,分割结果存在粘连问题。为解决这两个问题,分别从轻量化模型和追求精度的角度设计了两个网络。目前
多分辨率协同交通仿真是一种结合不同分辨率交通仿真模型,构建复杂交通仿真系统的方式,可有效提高仿真结果的可靠性。目前多分辨率协同交通仿真主要应用于微观与次微观交通仿真模型,针对大规模仿真场景下,结合中观交通仿真模型的研究较少,因此论文设计并实现基于中观交通仿真平台MATSim与微观交通仿真平台SUMO构建的多分辨率协同交通仿真系统。论文主要贡献如下:(1)设计并实现基于Openlayers的MATS
在国际竞争日益激烈的今天,培养有见识、有责任感、有行动力的公民显得尤为重要。其中,作为学生发展核心素养之一的社会责任感培养更是重中之重。为了探索中学生社会责任感培养的有效途径,本研究充分发挥自身地理科学专业特长,根据地理学科的特点,紧跟时代发展和社会现实需求,深入挖掘地理教材中与社会责任感培养密切相关的知识,建构专业教学素材库、设计简单高效易实施的教学方案,将学生社会责任感的培养融入到地理教学实践
核酸适配体是由指数富集技术在体外对适配体进行系统分离,能够特异性识别靶标分子的寡聚核苷酸片段。适配体对靶标分子具有良好的亲和力和识别力,主要通过静电作用、氢键、范德华力的协同作用以及疏水相互作用,折叠成特定的三维结构,如假环、凸环、发卡、G-四链体,在空间上与靶标特异性结合,从而与靶标高特异性高亲合力结合。随着纳米技术和分析方法的快速发展,出现了大量专门用于检测农药残留的适配体传感器,与基于抗体的
3D骨骼数据动作识别通过分析骨骼数据内部规律对动作进行分类,是计算机视觉领域的研究热点。广泛应用于虚拟现实,人机交互和无人驾驶等领域。针对现有研究者采用的关节点距离仅依靠简易人体骨骼图进行定义的问题,本文提出融合关键距离时空特征的动作识别。在简易骨骼图的基础上考虑人体结构和人体运动的复杂性,定义三类关键距离。针对单视角下深度相机跟踪关节点运动存在的自遮挡问题,本文提出基于三视图融合的动作识别。将单
土壤磷缺乏状况日渐严重,每年需要添加大量的磷肥以保障农产品生产的需要,由于作物吸收率较低,容易造成磷素流失进而产生局部面源性污染。从保障农业生产的绿色、可持续发展和生态环境保护的角度看,利用低分子量有机酸活化土壤磷的研究显得尤为重要,其关键之处通过低分子量有机酸种类和浓度的选择,为大范围、大面积推广应用有机酸调控土壤磷提供技术支撑。国内外已有不少关于有机酸的生态作用这一方面的研究,但迄今研究所得结
近年来,随着互联网的迅速发展和普及,社交网络在信息、思想和影响力传播等方面发挥着越来越重要的作用,已成为人们获取和交流信息的主要媒介。著名的社交网络平台包括Twitter、Facebook、微博等,为人们创造了交流与合作的新世界。由于其广泛的现实应用,社交网络中节点影响力的评估和社区发现已经成为了重要的研究热点之一。现有的部分研究通过改进传统的Page Rank算法来评估节点影响力,取得了一定的成