【摘 要】
:
不均衡分类问题在实际生产生活中频繁出现,如生物信息学、电信或金融风险评估和文本分类等。传统分类器由于期望整体精度最大化,常常忽略少数类(样本较少的类别)的分类精度,然而少数类的分类精度往往比多数类(样本较多的类别)更为重要。针对这一问题,一种有效的解决方法是基于数据增强将不均衡数据恢复为均衡数据。这种方法的目标是生成具有较强类判别性和多样性,且真正有助于分类器构建的少数类新样本。然而,在不均衡数据
论文部分内容阅读
不均衡分类问题在实际生产生活中频繁出现,如生物信息学、电信或金融风险评估和文本分类等。传统分类器由于期望整体精度最大化,常常忽略少数类(样本较少的类别)的分类精度,然而少数类的分类精度往往比多数类(样本较多的类别)更为重要。针对这一问题,一种有效的解决方法是基于数据增强将不均衡数据恢复为均衡数据。这种方法的目标是生成具有较强类判别性和多样性,且真正有助于分类器构建的少数类新样本。然而,在不均衡数据中,少数类样本稀少,难以挖掘其本质结构,仅依靠少数类的观测信息难以生成高质量样本。现有方法未对这些问题进行深入研究,数据增强与分类性能不尽如人意。因此,为了更好地解决这些问题,提升不均衡分类性能,本文提出两种新的基于自编码的数据增强与分类方法。针对不均衡数据分布特征难以挖掘的问题,本文提出了一种新的基于有监督类分布学习与生成对抗网络的不均衡分类方法。该方法分为两个阶段。第一阶段的目标是在瓦瑟施泰因(Wasserstein)自动编码框架下,通过有监督的类分布学习方法准确地确定类分布。第二阶段利用生成对抗网络,根据第一阶段学习到的类分布生成新样本,挖掘类间的分界面,训练最终分类器。实验基于不均衡分类领域广泛使用的四个数据集和三种评价指标展开,结果显示该方法能够有效提升不均衡分类的性能。针对仅依靠少数类的观测信息难以生成高质量样本的问题,本文提出了一种新的基于类间信息迁移与自编码的不均衡分类方法。该方法在第一个阶段基于类原型学习与熵值最大化在隐空间学习类判别性信息和类间可迁移信息。第二个阶段将少数类的类判别性信息与多数类的类间可迁移信息结合生成新样本。最后,使用分类器结合类原型信息进行各类之间清晰边界的估计。实验结果表明该方法能在保持较高整体分类精度的同时,提升少数类样本的分类精度。
其他文献
当今,履带式作战车辆层出不穷。针对履带车辆的传统路障多为固定形式,且需要提前布设。为应对现今履带式车辆,阻拦其移动,本论文对可变形多面体路障机器人进行研究。目的是提升反履带式车辆装置的灵活性,升级反履带式车辆装置的功能。首先对履带车辆以及传统阻拦履带的设施进行了调查与研究,分析传统式路障设施的机理,了解多面体机器人的相关研究进展现状。创新性地提出了以多面体作为基本构型的可变形多面体路障机器人。分析
随着足式机器人多年的快速发展,足式载运平台在多种领域得到了广泛的应用。相比于轮式和履带式等传统移动方式,足式机器人在山地环境、物流运输、教育娱乐和星球探测等场景发挥的作用与日俱增。与此同时,闭链多足机器人与串联多足机器人相比具有少驱动数目、高运转频率和突出的负载能力等特性,但因为其足端轨迹的单一、地形适应性差,限制了闭链多足机器人的多场景应用。因此,以研制适用于多场景多轨迹的足式机构为目标,优化突
纳米机械传感器因其灵敏度高、体积小等优点,在生物、化学传感器的应用中得到了广泛的研究。微悬臂梁光波导传感器作为一种新兴纳米机械传感技术,其将机械力学中的悬臂梁结构与光波导技术结合。当悬臂梁在静态模式下表面受力时,偏转挠度改变会使悬臂梁光波导与输出波导间的光耦合功率发生变化,通过结构的输出光功率变化可以实现对悬臂梁偏转的高灵敏度检测。这种检测技术不仅具备纳米机械传感中已有的灵敏度高、体积小等优点,相
随着工业化的快速发展,保证机械特别是大型旋转机械的正常有序运行,对工业生产和生活起着至关重要的作用。滚动轴承是许多大型旋转机械的关键部件,旋转机械的长期安全运行与滚动轴承的稳定性密切相关。因此,研究针对于滚动轴承的故障诊断方法具有十分重要的意义。大数据时代以来,传统的故障诊断方法需要大量的人工处理过程,已经无法顺应大数据时代的发展要求。由于可以从原始数据中自动提取特征的优势,深度学习在机械故障诊断
人脸聚类是利用未标记人脸数据必不可少的工具,在人脸数据库构建、人脸图像标注等方面具有广泛的应用。一般来说,人脸聚类效果的优劣,主要受到所采用的特征提取方法和聚类算法设计这两方面的影响。随着深度学习在人脸识别上的应用,深度面部模型已经成为目前主要的人脸特征提取方式。现有多数人脸聚类算法是基于卷积神经网络提出的,聚类规则采用相似性度量,但卷积神经网络更适合处理欧式空间的数据,因此,如何有效学习到不同簇
随着数据通信业务量的指数级增长,人们对高速无线技术的带宽和质量要求不断提高,云无线接入网(Cloud Radio Access Network,C-RAN)前传链路的容量受限问题难以忽视,为降低数据存储对带宽的需求,本文将压缩感知(Compressed Sensing,CS)技术应用到C-RAN前传受限链路,并进行射频拉远端和基带处理池功能分配,减少了C-RAN前传链路负载,提升了传输信号的恢复精
近些年来,多智能体系统的协同控制被广泛应用于智能机器人、无人机编队、人造卫星等领域,引起了诸多学者的注意。目前,多智能体系统的协同控制问题主要包括一致性控制、编队控制和包含控制等,在此类问题的研究中,智能体之间的信息传递是至关重要的。通常情况下,我们用拓扑图来表示智能体之间的通信关系。在以往的研究中,多智能体系统的通信拓扑大多被假设为固定拓扑,而考虑到多智能体系统所处操作环境的复杂性,智能体之间的
实际工程系统往往都设有物理安全边界,例如流水线工业系统,风力发电系统,电力系统,高铁系统等,运行过程中系统自身状态受物理边界严格约束,以确保长期稳定可靠运行。一旦这样的物理约束装置被忽略或发生故障,系统就面临超界运行风险甚至发生重大安全事故。随着工业生产复杂化,相应的生产装置和系统的非线性特性日益凸显,系统参数不确定性也随之增加,系统控制器设计难度也随之增加。因此,针对具有参数不确定的非线性系统的
定位技术是实现移动机器人自主导航的关键技术之一。视觉SLAM是一种同时完成定位与地图构建的技术,目前得到了越来越多的应用和研究。针对视觉SLAM在一些室内场景无法有效定位的问题,通常借助自身算法框架的冗余性完成重定位。但是该方法导致了定位实时性的下降,当机器人快速移动时,这种影响尤其明显。为了避免冗余的算法框架对视觉SLAM定位实时性的影响,本文通过引入IMU来辅助视觉SLAM,实现多种工况下机器
头部运动障碍或头部下垂综合征(DHS)在许多运动神经元疾病中十分常见,患者的颈部肌肉发生退行性减弱,使得抬头或移动头部变得十分困难。目前该疾病没有较好的治疗方法,主要使用颈托设备来缓解头部下垂的症状。然而,颈托使得头部的运动受到局限,也不能按照患者想要的移动方向进行调整。因此,研究一种可以实现临床治疗、功能全面、康复机理完善、操作方便的颈椎康复机器人,对于治疗、康复头部下垂综合征有着重要意义。本文