基于基因表达数据的肿瘤分类方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:tomily98
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会随着人们生活水平的提高以及生活习惯、饮食习惯的改变,肿瘤的发病率和死亡率迅速上升,已成为威胁人类健康的主要疾病。肿瘤的早期诊断和治疗是减少肿瘤患者死亡率的关键。临床上常用的肿瘤检查方法包括有创检查和无创检查。不管是有创还是无创检查,都需要根据检查结果做出诊断,即分类。但当前的肿瘤分类技术高度依赖于病理学工作者对肿瘤组织的主观判断,靠他们的观察诊断难以避免经验差异、疲劳疏忽等人为因素的影响,误诊、漏诊等情况时有发生。而基于基因表达数据的肿瘤分类系统能够避免人为的主观因素带来的误判,完全基于客观的数据做出客观的评价,因此一个速度快,准确率高的分类系统是当前基于基因表达数据的肿瘤分类所面临的最大困难。而基因表达数据呈现高维小样本的特性,并且由于人为因素、环境改变等也会引入复杂的噪声。如果直接对其进行分类,误差太大,因此在分类之前必须采用有效的降维算法对其进行维数约简(即特征提取)。本文在分析传统的降维算法(如PCA、LDA、LPP、NPE等)的同时,引入了子空间的图嵌入降维算法,并将这些降维算法及其扩展置于图嵌入框架中。然而这些方法都要分解稠密矩阵,使得运算时间和耗费的物理内存迅速上升,分类正确率却不高。为了克服这些缺点,引入谱回归(Spectral Regression,SR)分析算法用于对基因表达数据进行降维。降维的最终目的是进行分类,本文实验对比分析了各种分类方法,在k-近邻的基础上提出了核空间k-近邻分类算法,同时吸取支持向量机的优点,并结合谱回归降维算法,最终将核空间k-近邻—支持向量机(KKNN-SVM)用于基因表达数据的分类。例如,在对数据集4_Tumors用谱回归进行降维后,分别用k-近邻和核空间k-近邻分类时,每类选取4个训练样本的情况下,前者识别率达到88.98%,后者为91.01%。该方法大大节省了计算机的物理开销和时间开销,为临床诊断和治疗提供决策支持。
其他文献
针对高层建筑施工过程中常见的高空坠物打击伤害的安全问题,提出采用规范搭设外悬挑式钢管防护棚的方法防止安全隐患,并对案例进行安全验算、效益分析,证明了该方法经济、有
本文就对于西门子S7-300系列中的CPU315-2DP组成的控制系统与日本SMC的SV2000/SV3000系列的阀岛的相互连接及应用作以简要介绍。
天然橡胶加工废水浓度高 ,且间歇排放 ,但具有很好的可生化性。经好氧和厌氧试验 ,并据土地的可得性 ,提出了稳定塘系统及稳定塘与生物滤池相结合的处理工艺 ,并给出一设计实
今年上半年,国家实现积极的财政政策,消费需求持续旺盛:同期铜的新增资源势头也很强劲,特别是进口成倍增长,使得供求关系仍为货源宽松的买方格局。主要受国际行情触底回升的
供水管网作为输水设施的一部分,对于智慧城市的建设和维持社会的发展有着至关重要的作用。管网的漏损是城市供水系统中比较普遍的现象,也是社会所面临的难题。影响漏损的因素
社会生产方式的改变促进了作业成本法的产生,作为传统成本法的完善和发展,二者之间既存在区别又有着联系。深入了解和正确认识这些区别与联系,是成本会计中重要的一部分。因
目的观察生大黄联合乌司他汀治疗重症急性胰腺炎的临床疗效。方法入选济宁市附属医院住院确诊的重症急性胰腺炎患者88例,随机分成治疗组、对照组两组。对照组给予禁饮食、胃
欧洲和美国市场氧化钼价格在3月第二周中期剧涨,周末涨到10.25美元/磅。这是时隔10年氧化钼价格再次超过10美元/磅;在1994年末到1995年春季间,氧化钼价格曾超过10美元/磅。目
水利部2015年2月出台了推行代建制管理的指导意见,在水利建设项目特别是基层中小型项目中推行代建制等新型建设管理模式,对发挥市场机制作用、增强基层管理力量、实现专业化
当下,职业倦怠已成为高校档案管理人员工作中普遍存在的一种现象,影响着高校档案管理工作的开展。本文在阐述职业倦怠概念的基础上,具体分析档案工作者出现职业倦怠的原因,并探讨