半监督深度模糊C均值聚类与分类

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jackieWXM
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督学习已经成功地被运用于基于动态数据分析的数据挖掘和机器学习等研究领域之中。非平衡类的学习是分类问题中最具挑战的问题之一。不同于平衡数据,用于模型训练的冗余且不相关的特征会影响分类模型的性能。近年来,学者们大多着眼于非平衡数据的二分类和多分类问题。本文的要点如下。1.提出了一种半监督深度C均值聚类算法(DFCM)用于非平衡数据的二分类和多分类问题,可以用于数据边界不清晰和需要额外参数来减少统计近邻的情况。该算法是一种针对分类模型的二阶段数据预处理技术。2.提出了一种基于特征提取的半监督深度模糊C均值算法(DFCM),利用有监督和无监督数据的深度多层次聚类来创造新特征,试图通过模糊C均值算法(FCM)最大化类内分类和类内特征。同时,本算法针对多类不平衡数据利用了对多层次聚类的解构策略,将类内分类和类内特征之间的最大相似度一对一的联系起来,可用于求解重叠问题。3.将重新采样(随机欠采样和随机过采样)与特征选择相结合,提出了一种特征选择方法,降低非平衡分类问题的数据噪声,进一步改善预测性能。最后,通过有类标和无类标数据特征的最大同质区域来预测分类结果。4.为了验证算法的有效性,我们选择了来自真实软件项目的数据库进行实验:NASA和Eclipse来测试非平衡数据的二分类效果,18UCI来测试非平衡数据的多分类效果,并且将我们的算法同现有的非平衡数据的二分类和多分类器的性能进行比较。评估指标有 Pd、Accuracy、F-Measure 和 Area Under the Curve(AUC),还测试了影响算法性能的各种因素。实验结果表明本文提出的DFCM算法在所有类型的非平衡数据二分类和多分类问题中表现稳定且效果良好。
其他文献
近年来,随着电子设备功能和性能的不断提升,电子设备的体积越来越小,装配的元器件数量越来越多,器件运行功率越来越大,导致热流密度和安装密度急速攀升。因此,对电子设备的热控制能力提出了越来越高的要求。微通道换热以其结构紧凑、换热效率高、工程实现性好等诸多优点,作为一种高效的换热形式被海内外研究者们广泛关注。微通道换热结构形式多样不胜枚举,以蛇形微通道换热结构和带有翅片的微通道换热结构散热效果最理想。本
逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)成像技术凭借其全天时、全天候以及高分辨的独特优势,在军事和民事领域都扮演着重要的角色。ISAR通过对空间、空中和海洋目标进行高分辨成像,为非合作目标的分类和识别提供了有力的技术支撑。为了满足越来越丰富的应用需求,ISAR正朝着多功能、多维度和精细化的方向发展。工作模式和系统结构的多样化,以及目标运动的复杂化
汽车数量的迅速增加导致全球能源消耗和温室气体排放量不断增大,如何减少能源消耗和碳排放量成为汽车工业面临的一个重要挑战。诸多学者正致力于研究的以减小车辆能耗为目的的新技术主要专注于对车辆本身的改进和控制,而把道路坡度作为影响车辆能耗的外部因素。不同于现存的许多方法,本文从优化道路坡度的角度研究降低车辆能源消耗的方法和技术。本论文主要贡献如下:本文提出了在车辆按照既定速度曲线行驶的条件下减少其总能耗的
人脸表情识别技术是一个涉及到心理学、生物学、计算机学等等多门学科的交叉产物,由于人脸表情识别研究具有极高的应用价值和研究意义,近十年来,一直是人工智能领域的一个研究热点。得益于硬件技术的提高和深度学习技术的发展,人脸表情识别研究对象已经从实验室控制表情样本转移到了自然场景表情图像,同时也促进了人脸表情识别相关应用市场的蓬勃发展。反过来讲,迅猛发展的应用市场又对人脸表情识别研究提出了更高的要求,例如
利用机器可读的人类知识来赋予计算机权力一直是人工智能的长期目标。通过知识收集的进步,这一目标取得了巨大进展。在过去几十年中,自动知识库构建引起研究团体的广泛关注,并在以实体为中心查询应答方面取得重大进展。知识图谱因存储有关常见实体的事实,自然成为语义搜索核心。如今,公开可用的知识图提供数百万个实体(例如人,组织,位置以及诸如书籍,音乐等创意作品)以及数十亿个有关实体的陈述(例如谁在哪里学习,哪个国
海量视频图像下的高性能视频目标跟踪技术已广泛应用于安防监控、自动驾驶、人机交互以及精确制导等民用和军事领域,是当前计算机视觉和人工智能领域的研究重点。理想的视频目标跟踪系统应当具备精准捕获和长时稳定跟踪目标的能力。然而,受复杂背景和高动态场景变化的影响,跟踪性能往往具有较大的局限性。跟踪中,如何更好地建模感兴趣目标,增强其表征能力,并准确估计其位置是亟需解决的关键问题,具有重要的理论和实际意义。早
氮化镓材料相对于传统半导体材料具有高击穿场强、高电子迁移率和饱和速度,高温和辐照下高可靠性等显著优势,在电力电子和射频微波电子器件领域展示出巨大的潜力。然而,在常规的横向结构电子器件中,电流崩塌和自热效应等是制约着器件发展的重要问题。在此背景下,纵向结构GaN电力电子器件成为了突破障碍的新方向,其具有功率密度高,可靠性高,热分布均匀等优点。而基于异质衬底的准垂直结构电子器件由于衬底成本低,兼具性能
机器间(Machine-to-Machine,M2M)通信是指在没有人为干预的条件下,机器与机器之间通过通信网络自主地进行数据传输。作为第五代(Fifth Generation,5G)移动通信实现万物互联的主要连接方式,它被逐步地应用到智慧交通、智能家居、电子医疗、远程监控等物联网行业,这使得机器类型通信(Machine Type Communication,MTC)设备的连接需求与日俱增。当大量
海杂波特性研究在雷达探测、海面目标检测及微波遥感等领域具有重要意义。本文主要基于海洋环境参数和深度学习模型研究不同海域的海杂波特性,建立了海洋环境参数与海杂波特性之间的关联模型,并分析了不同海域影响海杂波特性的海洋环境参数因子,为不同海域目标探测、不同波段雷达参数选择及性能提升提供数据和理论支持。本文的主要研究内容及成果特色概括如下:1.本文首先基于欧洲中尺度天气预报中心提供的大量海洋环境参数数据
无人机(UAVs)己成为无线网络的重要组成部分,同时也是5G和未来无线物联网的关键推动因素。UAV作为空中基站,在覆盖范围、连接性和频谱方面提高蜂窝网络性能。无人机机载基站可提供高质量的网络连接并扩展无线蜂窝网络的覆盖范围。此外,UAV可以作为蜂窝网络内的飞行移动终端,支持实时视频流以及物品的递送等多种应用。然而,在UAVs无线通信网络体系的设计和部署中仍然存在许多具有挑战性的问题,如能量和干扰管