基于多角度融合的特征选择算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:laohuob
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于科技的高速发展,生物数据正处于爆炸式增长的时代。从复杂、高维的生物数据中挖掘出有价值的信息对于研究问题的本质具有重要意义。特征选择是处理高维生物数据的一种有效手段,它可以从原始特征集合中去除大量无关的、冗余的特征与噪音,筛选与生物问题高度相关的特征子集,被广泛应用于生物标志物的发现与疾病分类等方面。生命活动是复杂的,分子间通过相互作用共同完成生物功能。因此在寻找生物标志物的过程中,不仅需要考虑分子自身的分类性能,同时也要考虑分子间的关联性。本文从分子层面与网络层面两个角度衡量特征的区分能力,提出了FS-ODND算法。FS-ODND算法利用特征在不同类别上有效范围的重叠程度计算特征权重,从分子层面度量特征的区分能力。利用比值变量的非重叠度构建网络,用网络中节点的度计算特征的权重,从网络层面度量特征的重要性。在八个公共生物数据集上将FS-ODND算法与Degree、ERGS、Relief-F和SVM-RFE四种方法比较,实验结果表明FS-ODND算法在分类准确率、选择特征数以及稳定性均优于其他方法。生物系统十分复杂,不同种类的生物样本的差异可能体现在某些单变量上的分布差异,也可能体现在变量间关系的变化。本文综合评价单变量与对变量,提出FS-SVPV算法。该算法基于信息增益构建单变量分类器,采用M-k-TSP的评价准则评估单变量和对变量的水平关系所包含的差异信息,选择区分能力最强的单变量、对变量构建分类模型。在十一个公共生物数据集上的实验表明FS-SVPV算法所构建的分类器在大多数情况下优于M-k-TSP算法与SVFS算法,说明综合评价单变量和对变量,可以更有效地挖掘富含信息的变量。本文提出的两种特征选择方法均是基于融合的方式,FS-ODND算法是从分子层面与网络层面两个角度衡量单变量的重要性,FS-SVPV算法同时考虑了单变量与对变量的区分能力,实验结果表明了基于融合方式的特征选择方法的有效性。
其他文献
现今社会已经步入高度信息化的时代,软件行业迅猛发展,软件产品销售额节节增高,软件客户群体急速增加。软件的整体规模依旧可以十分庞大,但由于手机,iPad等智能终端的介入,软
远缘杂交可以有效增加后代的遗传变异,通过该方法还能获得不同倍性的后代,包含同源四倍体和异源四倍体。我们通过远缘杂交的方式,利用红鲫(♀)与团头鲂(♂)进行亚科间杂交建立了
随着无线通信技术的日益发展,引入带内全双工(IBFD)通信模式以实现频谱效率倍增成为一个当前研究热点。IBFD能够实现同时同频传输信号,这得益于自干扰抵消技术。论文面向Ad H
工业控制系统主要用于工业生产过程中的各种监督和控制,被广泛应用于能源、电力、化工、污水处理等大型国家基础设施行业。近年来,由于远程管理控制的需求不断扩大,之前相对
随着机器人领域的迅速发展,许多计算机视觉系统也得到了发展。立体视觉作为一种计算机视觉技术,它能够实现通过使用两个对齐的相机从场景中提取深度信息。而深度图像可以通过
许多信息处理系统需要高分辨率的图像来进行有效的操作。而图形的分辨率受系统物理参数的要求,这在许多与图像采集相关的应用上都是需要解决的问题。因此,提出对图像序列的处
软件测试对于检测软件开发和维护过程中的软件故障至关重要。软件测试的有效性主要由测试用例集的质量决定,高质量的测试用例集可以有效发现被测软件(SUT)的故障。另一方面在
随着我国各行各业近年来的蓬勃发展,各种工业控制系统在生产过程中得到了广泛的应用,但由于各企业建设时期的不同及采用标准规范的不统一,致使不同形式的各种工业控制系统之
随着人类社会的迅速发展,信道传输环境越来越复杂,信号传输过程中由于时间选择性衰落和频率选择性衰落的影响导致信号失真,通信系统的传输性能受到较大影响。因此需要分析信
近些年来,随着计算机视觉的发展,运动目标检测与跟踪技术在军事、交通、环境监控等领域得到了广泛的应用。基于摄像机固定条件下的运动目标检测与跟踪技术已经逐渐成熟。然而