基于优化算法的基因选择与癌症分类

被引量 : 0次 | 上传用户:ivy1128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着DNA微阵列(DNA microarray)技术的高速发展,研究人员可在一次实验中同时测定成千上万个基因的表达数据,这些数据对了解疾病在基因级别的发病机理、疾病的诊断、基因级别的药物研制以及基因治疗都有着很高的应用价值,而且在基因组水平上进行癌症研究提供了最基本和必要的信息及依据,在生物学和医学研究中正受到越来越多的应用。然而,在这成千上万的基因表达数据中,只有少量可以研究的样本,造成了严重的维数灾难现象,从而导致分类性能的严重下降,而且在这大量的基因表达数据中,有大量冗余的与癌症分类诊断无关的噪声基因,这就造成了对疾病分类的不准确性,并且数量如此庞大的基因还大量的耗费了医学诊断的费用。因此选择出对疾病有鉴别意义的特征基因或与疾病相关基因至关重要。特征基因选择问题是利用生物信息学技术处理基因表达数据急待解决的关键问题,也是机器学习中研究领域中的一个挑战性课题。针对基因表达数据“高维样本少”的特点,本论文提出了基于优化算法与支持向量机的基因选择算法,本论文的主要贡献有三个方面:(1)提出了基于遗传算法与支持向量机的基因选择算法,算法在全局的基因集合上寻找优秀基因子集,避免一些相关性强的基因被选择而影响对疾病样本的分类效果。(2)提出了基于粒子群算法的基因选择与支持向量机优化的算法,算法在寻找最优基因子集的同时,对支持向量机核函数的参数进行了优化选择,保证了被选择的基因子集是较适合优化后的支持向量机。(3)提出了基于混合粒子群算法与遗传算法的基因选择算法,算法在二进制粒子群算法的基础上引入遗传算子(选择,交叉,变异)来寻找更优的基因子集,一定程度上解决了粒子群算法在寻找优秀基因子集时容易陷入局部最优的情况。通过在公开的基因表达数据集上的实验仿真表明,提出的算法不仅能够选择出数目较少的关键诊断基因,而且被选择的基因具有良好的分类推广能力。
其他文献
目的观察中西医结合治疗原发性肾病综合征的临床疗效。方法将来我院就诊的成年人原发性肾病综合征患者138例随机分为观察组与对照组各69例,给予对照组以西医常规治疗,观察组
教育体制改革引发了图书馆空间变革。在此,论述了高校图书馆交往空间的作用与重要意义,及其划分标准,归纳了高校图书馆交往空间设计常用的几种手法,并总结了其设计方法。
阐述了工程项目管理中成本与进度控制的关系是相互影响和制约的辩证关系,用赢得值分析法的基本理论和三个基本参数,来分析某工程项目进度和成本同步控制中所存在的问题,并提
目的研究补钙与妊娠高血压病的关系。方法对在门诊行产前检查的孕妇120例,随机分为两组,实验组孕周为20~24周后开始补钙,对照组不用任何药物。结果实验组妊娠合并高血压疾病发
目的考察丹皮酚在清胃散传统汤剂与配方汤剂以及清胃散颗粒剂和配方颗粒剂中的含量变化。方法采用高效液相色谱法测定清胃散中丹皮酚的含量和气质联用技术分析方中的挥发油成
<正>经期延长是指月经周期基本正常,行经时间超过7天,甚或淋漓半月方净者。相当于西医学的排卵型功能失调性子宫出血病的黄体萎缩不全、盆腔炎性疾病、宫内放置节育器及输卵
《淮南子》是汉代的一部绝代奇书。然而,这部奇书却是孤独的,默默地忍受着不公正的待遇,被视为“杂”书。本文就是力图给它以应有的评价。笔者认为它总结了汉初70年左右历史的兴
目的比较针灸加耳穴贴压与常规药物治疗耳鸣的临床疗效差异。方法将120例病人随机分为针灸加耳穴贴压组(治疗组)与常规药物组(对照组),每组各60例。结果治疗组与对照组比较,
糖尿病肾病是糖尿病最常见并发症之一,目前干预NF-κB信号通路治疗糖尿病肾病已成为一个热点,中医药在糖尿病肾病中干预NF-κB信号通路的研究已经取得一定成果,向人们展现了