【摘 要】
:
在大数据的时代背景下,为了从超大规模的高维数据中快速获取有效信息,特征选择至关重要也备受关注。基于特征分组的特征选择方法由于其兼顾了最大化特征与类别之间的相关程度
论文部分内容阅读
在大数据的时代背景下,为了从超大规模的高维数据中快速获取有效信息,特征选择至关重要也备受关注。基于特征分组的特征选择方法由于其兼顾了最大化特征与类别之间的相关程度和最小化特征间的冗余度的优势而被广泛接受,而视觉注意机制的显著性计算方式与特异性处理机制又对分组排序特征选择方法产生了奇妙的启发。本文受这种启发影响,分别模拟其对相关信息的特异性处理策略和对显著信息的显著性计算策略,形成分组排序的新思路,提出分组排序特征选择(Grouped Sorting Feature Selection,GSFS)算法。首先从特征分组和排序过程与视觉注意机制两种策略的相似性入手,介绍GSFS算法与视觉注意机制的模拟—启发关系,结合特征分组和排序指标的介绍,确定基于最大信息压缩指数和Fisher分数的GSFS算法并详述其基本原理,构建合适的最佳分组数目确定准则和最优特征子集确定准则并实现了算法流程。随后在8个不同维度,不同类别数的标准数据集上进行了分类实验和去冗余效果测评,通过和6种经典特征选择算法的实验结果对比说明GSFS算法选出的最优特征子集分类能力优良且所含冗余信息最少,从而证明了GSFS算法在解决特征选择问题时的有效性。在GSFS算法的理论基础上,为进一步解决高维数据集特征选择中计算复杂度较高的问题,又提出基于分布式处理的分组排序特征选择(Distributed Processing based Grouped Sorting Feature Selection,DP_GSFS)算法。它采用将原始特征集均分的方式,减少特征对之间相关性度量的计算复杂度以提高计算效率。在6个标准数据集上的分类实验和去冗余效果测评分别验证了DP_GSFS算法分类能力和去冗余效果的基础上,两种算法的对比实验结果表明DP_GSFS算法仅需设置合适的分组数,就可以显著降低计算时间,由此证明了其在提高计算效率方面的作用,这也可以为将来超大规模海量数据集的快速分析处理提供有价值的参考。另外,本文还将算法应用在真实医学图像特征数据集上,特征选择的效果和分类结果也证明了其解决实际问题的能力。
其他文献
随着科学技术的不断发展,数字图像处理技术在各领域得到了广泛的应用。在实际应用中,往往要对原始图像预处理。预处理的好坏,对后续工作有着重要的影响。本文重点对图像预处理的
仿人步行机器人因其与其他多足机器人相比具有体积小、重量轻、动作灵活、迅速,而且更接近于人类步行的特点,加上他们对环境有最好的适应性,因此,对仿人机器人的研究有着泛的
机械装备制造业是国民经济发展的一个重要基础,汽车起重机行业作为装备制造业重要的组成部分之一,为城市快速建设提供了良好的保证。汽车起重机吊装过程是非常复杂的过程,吊装方案的制定十分困难,方案制定的好坏,直接影响到吊装的安全性以及成本消耗。本文以提高吊装方案制定的效率、提高安全性能、减少成本消耗为目的,在虚拟现实技术下,研究基于多目标的吊装路径规划算法,主要工作概述如下:首先以汽车起重机吊装基本操作起
本文以医药溶液中的大输液产品为例,进行了可见异物视觉识别和分类方法的研究,用机器视觉来模拟人眼,确保识别和分类方法的有效性和精度,最终实现对大输液异物的准确识别和分类,且
污垢是导致工业换热过程能耗高、低效的根源。由于污垢产生条件、影响因素及作用机理的复杂性,目前很难用数学模型对其进行准确描述,实际应用的需要催生了将人工智能应用于污垢在线监测的需要。尽管已有较多换热设备污垢进行检测的研究,但在污垢形成过程仍存在着检测精度不高并且也尚无一种高效、方便、完整的检测流程对污垢结垢程度进行量化。超声波技术应用于检测污垢的研究在膜分离污染已有大量研究,而对于各种换热设备中管道
作为一类特殊的混杂系统,切换系统是研究混杂系统理论的一种重要模型。切换系统是由一系列连续时间或者离散时间子系统及一条作用在其中的切换规则组成的。由于切换的存在,系
流程工业的过程安全问题越来越受到重视,与此同时,大量记录在集散控制系统(DCS)和紧急停车系统(ESD)数据库中的历史数据也有待于充分利用。为此,论文提出了一种基于工业数据的过程报
随着功率密度的增加和开关频率的升高,开关电源的电磁兼容性越来越成为电源设计中的一大难点。常规设计方法中,依靠经验设计处理EMC问题,在样机建立之后才能对电磁兼容问题
近些年来移动机器人的发展吸引了越来越多的研究者的关注。随着机器人技术的发展,人们越来越要求机器人可以在运动过程中根据周围环境的变化自主采取相应措施。因此,路径规划
随着智能材料的不断发现和愈加广泛的应用,对于严重影响系统控制精度的智能材料的固有特性—滞环现象越来越受到重视;与滞环现象类似,时滞现象也广泛存在于各种装置和实际系