基于改进支持向量机递归特征剔除的胰腺癌生物标志物检测研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:yjtgu618215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,癌症已经发展为危害人们健康的重要导火索,临床案例逐年增多。在众多类型的癌症中,有些恶性肿瘤一般情况下预后较差,而胰腺癌可以说就是其中的一种。对于已经确诊的胰腺癌患者,若不加以医治,那么存活时间也就只剩下几个月,就算采取手术切除,大约只能多生存一年左右时间。根据美国癌症统计协会在男性和女性病例中的调查显示,目前胰腺癌俨然加入了死亡率较高的十大癌症行列。然而,截止到目前,还未出现一套完善可靠的可以早期检测出胰腺癌的标志物。因而,为了减小胰腺癌的死亡率,尽早筛查和及时医治显得尤为关键。随着机器学习的兴起,将机器学习算法融入到各种研究中的做法已是日益增多。本文就是基于机器学习方法,从而得到了一种通过融合基于支持向量机的递归特征剔除(SVM-RFE)方法和基于大间隔分布机的递归特征剔除(LDM-RFE)方法来探究胰腺癌临床标志物的方法。本文使用的癌症实验数据均来自于GEO数据库。在预处理阶段,我们还对包括了乳腺癌、胃癌、肺癌、肝癌、前列腺癌、结直肠癌等在内的其他十个GSE数据集进行了数据预处理,这样分别能够得到十个特征列表,然后将胰腺癌候选特征列表的特征与上述列表逐一进行比较,并删除胰腺癌的特征列表中相同的特征基因。通过上述方法,共处理得到了730个胰腺癌特异性差异表达基因。可以说,通过融合基于支持向量机的递归特征剔除方法和基于大间隔分布机的递归特征剔除方法,我们得到了一组稳定的特异性候选特征排序列表。最后,通过将我们的方法与随机法、t检验法、SVM-RFE法和LDM-RFE法这四种方法得到的特征排序列表比较,发现了我们提出的合并之后的分类效果是最佳的,其中在特征排序列表中排名前七的差异表达基因(MMP7、MMP12、ANPEP、FOS、SFN、IL6和A2M)能够被预测为胰腺癌的特异性生物标志物,因为它们对于癌症和正常样本的分类结果最好。在查阅文献后发现,上述基因的异常表达与某些疾病之间均有一定联系。此外,通过R2平台(基因组分析和可视化平台)进一步分析后,我们再次验证了上述选择的七个基因与胰腺癌患者的生存率息息相关。在尿排泄蛋白分析过程中,通过对于已经得到的胰腺癌的特异性生物标志物的探究,我们发现其中三个基因(MMP7、FOS和A2M)编码的蛋白质可以分泌到尿液中成为尿排泄蛋白,这有助于化作胰腺癌的临床检验所需要的重要依据。
其他文献
当前我国已进入全面深化改革的关键时期,重要战略机遇与社会矛盾日益凸显,面对新的发展形势,党中央迫切要求加强和创新社会治理,党的“十九大”报告中明确提出要“加强社会治
嘉绍大桥主航道桥是世界上首座六塔、双幅、空间四索面斜拉桥,全桥共有7个合龙口,合龙方案复杂。针对传统温度合龙工艺所存在的问题,基于几何控制法理论,首先给出了一种新的
由禾谷镰孢菌(Fusarium graminearum)引起的小麦赤霉病是小麦生产上最重要的真菌病害之一,除了造成减产和品质下降外,禾谷镰孢菌产生的毒素残留在谷物内造成粮食污染,对全球
工业4.0对现代工业生产系统的自动化、智能化、信息化都提出了更高的要求。过程数据包含着大量的信息,对系统监测和控制都有着重大意义。但是,仅凭常规测量时获取的温度、压强、物料流量和液位不能满足愈发复杂的工艺流程和监测要求,除静态数据之外,还需要动态的信息;另一方面,对仪器的精度和稳定性要求也越来越高。在一些实际应用中,为了实现高效、稳定、可靠的过程控制和系统故障诊断,需要综合多种仪表的测量信息。不同
荷花在我国有着悠久的审美历史,其实用性、观赏性以及园林造景等都有着丰富的文化内涵。在中华几千年的文明中,荷文化贯穿古今,衍生出的文化内涵和人文精神具有很高的生态审
透皮抽取式连续血糖检测技术因其微创、实时、高精度等特点,已经成为连续血糖检测技术领域的研究热点。为了进一步提高测量精度,促进透皮抽取式连续血糖检测技术的发展,本文
随着社会的发展和居民生活水平的提高,人们越来越关注自身的健康问题。由于运动损伤、交通事故、年龄增长等因素使骨骼骨折成为日常生活中常见的一种疾病,内固定是医疗上常用
随着我国智能电网的发展和用户对电能质量要求的提高,电力公司对状态估计基础数据的高效维护以及电网在线安全分析与调度控制水平提出了更高的要求。不良数据检测与辨识是电
化学需氧量(COD)是指在一定条件下,水中还原性物质所消耗氧化剂的量,以mg/L表示。还原性物质主要以有机物为主,COD过高,会导致水生生物缺氧死亡,水质变臭腐败,若灌溉农田会导致农作物生长不良,苯等具有较强毒性的有机物会对水生生物造成直接的伤害,对人体具有致癌、致突变、致畸性的风险。因此,快速准确检测COD能够反映水体受还原性物质污染的程度,进而制定相应的水处理工艺,保护人体健康和生态平衡。国标
在骨钻削手术过程中,医疗钻头与骨表面之间由于摩擦会产生大量的热。而骨作为一种生物属性材料,在钻削过程中当温度超过55℃并且持续时间达到30s时,就会发生骨细胞死亡。克氏