降维和SVM相结合的方法在基因数据中的研究

被引量 : 0次 | 上传用户:tftaofeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机作为分类的一个有效的工具,在近些年来取得了快速的发展,是上世纪90年代Vapnik提出的。支持向量机在其提出的时候,就开始受到了人们的广泛关注,并且凭借其自身良好的推广能力和泛化能力,受到了全世界各国研究者的一致好评和追捧。支持向量机是在统计学习基础下根据结构风险最小化原则提出的一种新的机器学习工具,作为一种重要的工具在处理高维小样本问题时显示出了极其强大的优势。随着支持向量机的不断发展,近年来在实际生活和工作领域中的应用也越来越广泛。在生物信息学的发展,通过制备的基因芯片可以得到所谓的基因表达谱数据,基因表达谱数据的典型特点是样本数目比较少,基因数目相对较高。基因表达谱数据在临床应用中越来越广泛,该数据在日常的临床医学肿瘤癌症诊断,及其正常患病样本的区分有着广泛的应用。降维作为一种重要的特征提取的工具,在处理高维数据的时候,显示出其强大的力量,能够有效地解决高维数据处理时带来的维数灾难等问题。降维按照处理方式不同分为:全局降维和局部降维。线性降维和非线性降维。通过对数据进行降维处理可以提取出高维数据在低维空间的本质的特征,提取出高维数据的本质特征之后,对数据进行分类处理。通过降维方法对数据处理,能够降低数据的维数,同时减小数据计算的时间复杂性,而且降维之后的数据去除了数据中存在的冗余信息,能够提高数据处理的精度。降维作为一种有效的数据处理方法在现实生活中处理高维数据越来越广泛,随着数据量的不断增加,降维的作用显得越来越重要。通过降维之后,能够提取出数据的本质特征,结合支持向量机分类,可以达到减少时间复杂性和提高精度的目的。本文首先对研究的基因表达谱数据做了简要的介绍,对这种数据的研究方向和发展趋势做了说明。然后简要介绍了基因芯片技术的特点以及用于肿瘤分类的基本流程。最后对基因表达谱数据的处理过程,其中包括特征是如何选择,特征的提取情况,以及分类器的分类情况做了分析,这里主要介绍了降维和分类的方法的优势。本文的工作主要如下:1.对基因表达谱数据进行分析,找出跟疾病有关的最少特征基因,并用一个较好的分类器进行分类预测。采用新的改进的记分准则RFSC去除分类无关基因;2.采用降维技术对“小样本,高维数”的基因表达谱数据进行特征提取,降低数据的维数,同时提高数据处理的精度,减少处理时间;3采用降维和分类相结合的处理手段,提高了实验的精度。并且能够有效的区分正常样本和患病样本;
其他文献
本文旨在针对大学英语口语教学中存在的问题,以输入、输出假设理论和元认知理论为指导,探讨如何通过开设英语演讲选修课把英语演讲和大学英语口语教学相整合,有效地完成大学
确立刑事附带民事诉讼中精神赔偿的法律依据是刑诉法解释第 10 0条的规定。其理论依据 :一是我国对于精神赔偿采用的是立法非限定主义 ;二是附带民事诉讼的实质是民事诉讼。
从性质与制度设计上看,洛克主张的是逻辑上的人民主权和代议制;而卢梭主张的则是实际上的人民主权和人民亲自行使主权,并坚决反对代议制;从目的上看,洛克是为个人权利和民事
近年来在能源危机和空气污染问题日趋严峻的情况下,各国都积极地发展纯电动汽车技术和推进纯电动汽车商品化。纯电动汽车的动力来源于电池组,因此整车性能依赖于锂动力电池组能
济钢原燃料仓储库房储备能力小、布局分散,从而增加了物流调运成本。济钢通过优化总图仓储布局、建立预警机制、加强计划管控、确定合理库存,降低了物流成本。减少调运费用约
脾气虚证的现代研究已涉及到消化、能量代谢、心血管系统及免疫等多方面 ,并在不同层次上获得了一些有价值的指标。综述了近 10年来脾气虚证本质的临床与实验研究的状况 ,并
由于深受“法典主义”思想的影响,我国司法制度表现出明显的大陆法系特点,导致了我国判决书说理性并没有形成制度,甚至判决书是否需要说理也处于长期的争论之中。我们认为,根
自从《侵权责任法》第三十六条的出台划定了网络侵权责任的基本规则以后,该条的理解和使用就一直备受公众的关注。多年以来学者们关注更多的是如何正确理解和适用该法条来划
脑卒中后癫痫是国内老年癫痫患者中最常见的类型,在临床上明确癫痫发作和癫痫的基本概念,对于正确认识和诊断卒中后癫痫发作及卒中后癫痫具有重要意义.关于脑卒中的临床类型
目的讨论鹿瓜多肽注射液致不良反应的临床特点及发生规律,为临床合理用药提供依据。方法对我院2年期间注射用鹿瓜多肽临床资料进行整理、分析。结果注射用鹿瓜多肽所致11例不