【摘 要】
:
随着基因微阵列技术的高速发展,人们可以同时快速地测量成千上万个基因的表达水平。在肿瘤疾病研究中,通过获取基因微阵列数据可以为癌症诊断、治疗、预测提供新的手段。但是
论文部分内容阅读
随着基因微阵列技术的高速发展,人们可以同时快速地测量成千上万个基因的表达水平。在肿瘤疾病研究中,通过获取基因微阵列数据可以为癌症诊断、治疗、预测提供新的手段。但是,原始的基因微阵列数据具有小样本、高维度特点,直接在此数据中进行分析处理是不现实的。因此,有必要在这些海量的基因数据中,找出对疾病有鉴别作用的基因,提高肿瘤诊断准确性。传统的统计学方法在基因选择中,表现出了较大的局限性。支持向量机(SVM)以统计学习理论为基础,采用结构风险最小化原则,能较好地解决小样本数据学习问题;另外,支持向量机采用核函数技术,能够解决数据非线性可分的问题。因此,在基因选择算法中,支持向量机表现出更强的适应性和优越性。本文基于支持向量机,对基因选择算法进行研究,完成的主要工作如下:1.介绍了基因微阵列数据的制作、特点及应用,分析了支持向量机的原理,并详细研究了SVM-RFE基因选择算法。2.在SVM-RFE算法的基础上,引入了序列前向选择方法。通过以组为单位同时进行特征消去和序列前向选择操作,加快了算法的运行速度,提升了分类性能。3.研究了基于自适应策略选取支持向量机核参数的方法。算法首先利用样本之间的2范数距离设置初始参数值,然后根据进行递归特征消去后重构的样本对核参数进行自动运算更新。4.提出了多SVM混合分类模型。利用不同参数下的多个SVM分别进行基因选择,然后合并各分类器选择出来的基因子集,最后再利用SVM-RFE得到最优的基因子集。算法通过对参数选取一组值代替仅选择一个值,克服了单个参数值选取困难的问题,能够得到更高的分类准确率。在三个公开的基因微阵列数据集上进行了实验,提出的算法能够得到更佳的分类性能。
其他文献
<红楼梦>里面的丫鬟们描写得成功的非常多,但是晴雯是曹雪芹倾注了最大热情的一个丫鬟形象.她一点没有下人的那些奴颜婢膝,面是任由自己的性格行事.她是一个率直、纯真、勇敢
北方重工旗下法国NFM公司近日斩获莫斯科地铁盾构机项目,设备将用于其地铁2号线主体隧道工程。这条地铁线是莫斯科市启动的一条长70公里地铁项目的一个部分,用以缓解交通压力。
研究恒流和恒压两种电晕充电方法极化后的聚丙烯(Polypropylene,PP)无纺布驻极体的电荷储存能力,以及极化参数对电荷稳定性的影响.结果表明,恒压电晕充电的样品具有较好的电
目的:了解急性胰腺炎治疗的用药情况,从而为临床合理用药提供参考。方法:对2008年1月至2010年1月收治的143例急性胰腺炎患者的用药合理性进行综合评价。结果:治愈70例,好转65例,
采用ICP-OES同步测定燃料油和润滑油中Pb,Fe,Mn,Al,Ba,Ca,Cu,M g,V,Zn,Si,P,S。样品经航空煤油稀释10倍后直接进样。考察了发射功率、雾化器流量及观测高度对测试的影响,确定
卢勃林斯卡地地铁线一期(沃尔斯卡性一契卡洛夫斯卡地)于1995年底投入运营。线路长12.7km,6个地下车站。这一工程进行了一些重要的技术革新。包括采用Herrenknecht液力盾构;带有ph
为解决油浸式电力变压器中低能放电、高能放电等放电性故障的定位问题,提出了基于油中金属分析(Metal In-Oil Analysis,MIA)的放电性故障定位方法。通过对变压器内部高故障概率
【正】 卫生部最近分两批公布了69种既是食品又是药品的动植物名单,它们是:乌梢蛇、蝮蛇、酸枣仁、牡蛎、栀子、甘草、代代花、罗汉果、肉桂、决明子、莱菔子、陈皮、砂红、
为调动学生学习的主动性和积极性,为学生提供适合自己特点的全面发展机会,培养复合型人才,拓宽学生就业机会,增强择业的竞争力,我们在教学过程中必须始终坚持做到“因材施教
铜绿假单胞菌是常见的条件致病菌,其致病因子的表达受群体感应所调控。实验室已有研究显示,环境因子铵会影响群体感应稳定、造成种群崩溃、防止致病感染。铁作为重要的环境因