基于条件关联互补基因建立乳腺癌预后模型

来源 :河北科技大学 | 被引量 : 0次 | 上传用户:chengm1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,全球女性患乳腺癌的比例越来越高,严重影响了女性的身心健康。尽管这几年对乳腺癌的诊断和治疗方案上都有所提高,但仍会有近一半的乳腺癌患者会因复发而导致死亡,使得乳腺癌患者的生存率得不到有效提高。因此,为了改善乳腺癌患者的临床治疗效果,降低其死亡率,有必要从分子机制上研究并建立乳腺癌的预后模型。针对乳腺癌基因表达量数据样本少而基因多这一特征以及基因之间复杂的关系,提出了一种对条件关联互补基因分组的筛选方法,然后对每一组进行逐步Cox回归,确立最终的乳腺癌预后模型。首先对数据集进行预处理及差异分析,选出在癌症样本中显著差异表达的基因,为特征的筛选节约时间;其次对显著差异表达基因中的条件关联互补基因进行筛选并分组,对每一组基因分别在训练集中使用逐步Cox回归拟合,在测试集中进行验证,确定了一个含有10个基因的乳腺癌预后模型。其中VWCE、SPDYC、CRYBG3、DEFB1、SEL1L2、NMNAT2这6个基因属于生存率的不利因素,AMZ1、GJB2、CXCL2、ALDOC这4个基因属于生存率的有利因素。通过对这10个基因建立贝叶斯网络结构,还确定了一个重要基因模块。为检验预后模型的有效性,分别计算训练集、测试集及整体数据集中的乳腺癌患者的风险评分,并依据训练集中风险评分的中位数将三个数据集的样本分为高、低风险组,依次绘制K-M生存曲线,K-M生存分析显示这两组的生存曲线显著不同,且通过了对秩数检验,P值都分别小于0.05;其次,为了评估这10个基因预后模型的准确率,计算出模型评估指标C-index值等于0.81,还分别对训练集、测试集绘制了5年和10年的时间依赖性ROC曲线,最终计算的AUC值均可达0.7以上。实验结果表明采用对关联互补基因建立乳腺癌预后模型的方法,能够很好的对高维数据进行降维,消除基因与基因之间的共线性问题,提高了模型建立的速度与精度,建立的模型是稳健的并且具有可解释性,由10个基因所建立的预后模型可以对患者的临床预测提供帮助。
其他文献
本文中,我们以几种特殊分布为例,研究了若干类型微分熵的特殊形式。首先,我们以Wishart矩阵特征值联合分布、随机量子态特征值联合分布以及随机密度矩阵对角线联合分布为例,定义并得到这三种分布下的Tsallis微分熵的解析形式。当参数趋近于1时,我们发现,这三种分布下的Tsallis微分熵包含了相应分布下的香农微分熵。其次,我们以Wishart矩阵特征值联合分布下、随机量子态特征值联合分布以及随机密
设X是拓扑空间,G是拓扑群.若连续映射π:G×X→X满足以下两条:(a)π(e,x)=x,(?)x ∈ X(这里e是G的单位元);(b)π(g1,π(g2,x))=π(g1g2,x),(?)g1,g2 ∈ G,(?)x ∈ X.则称π为
习近平总书记指出:“博大精深的中华优秀传统文化是我们在世界文化激荡中站稳脚跟的根基。”文化典籍是中国文化的载体,更是“中国故事”的具体体现。在大力倡导“中国文化走出去”、“讲好中国故事”的今天,中国古代典籍的重要性不言而喻。如何传播文化典籍,让其成为展示中华优秀文化的重要窗口,是值得探索的话题。同时,随着国际交往日益密切,越来越多的人开始学习中文。语言和文化密不可分,国际中文教育离不开对中国文化的
钢筋混凝土异形柱结构诞生于国家的墙体改革之际,因独特的结构形式造就其良好的建筑功能,越来越得到人们的青睐和追捧。但经研究发现,节点位置是异形柱结构的抗震薄弱点,导致异形柱结构未能得到普及。为提高异形柱节点的抗震性能,众多学者做了大量的试验和理论研究,发现异形柱节点抗震性能的影响因素有很多,包括轴压比、混凝土强度、钢筋强度、节点核心区配箍率、加载方向和配筋形式等。但受于成本和时间限制,针对异形柱节点
研究背景:卵巢恶性肿瘤(Ovarian cancer,OC)是最常见的女性生殖系统恶性肿瘤之一,具有高发病率、高死亡率的特点,其中上皮性卵巢癌(epithelial ovarian cancer,EOC)占多数。EOC发病隐匿,进展迅速,患者确诊时多为晚期,而错过最佳治疗时间。目前治疗方法有手术、化疗、放疗等,但疗效欠佳,因此迫切需要寻找新的诊疗策略。含MARVEL结构域的趋化素样因子超家族(CK
矿山钻孔应力计是一种监测冲击地压的矿用量测仪器,可以对冲击地压危险区域及危险程度进行实时预警。钻孔压力枕是钻孔应力计上用于承受压力的关键部件,其结构尺寸直接影响监测冲击地压的精度,增大钻孔压力枕的尺寸,可以使得钻孔压力枕在初压下更好地贴合岩体,能提高监测冲击地压的精度。但是随着钻孔压力枕尺寸的增加,又会产生耐压性能不足的问题,本文分析大尺寸钻孔压力枕的耐压性能,对提高钻孔应力计的可靠性和灵敏性具有
供应链金融是一种根据产品供应链上的真实贸易背景和供应链核心企业的信用水平,对供应链中单个企业或上下游多个企业提供的全面的金融服务。相对于商业银行普通的信用风险,供应链金融根据多重技术支持降低了中小企业自身的信用风险,为中小企业融资难的问题提供了新的解决办法。但在银行信贷运营和控制流程内,现实盈利结局和预想盈利目的可能产生背离,存在资本损耗的可能。通过对供应链金融信用风险的控制,商业银行可精确分辨供
随着社会经济的发展,中国能源消费逐渐增长,使得我国能源形势面临严峻挑战。近年来,随着太阳能事业的发展和建筑节能的要求,城市的发展和人民生活水平的提高,“太阳能与建筑一体化”和“全天候供热”已成为我国太阳能热利用的重要议题。针对农村建筑中空气源热泵在制热工况下蒸发器吸热热源单一的现象,提出了可同时吸收太阳能和空气能的新型直膨式太阳能/空气能热泵机组,把太阳能集热器和热泵蒸发器合二为一,可在制热工况下
地下综合管廊作为生命线工程的基础设施,将设置于地上地下的各类市政管线集中在一起,进行统一的维护和管理。地下综合管廊能够有效的解决由于管线乱埋而导致的地下空间不合理利用,其良好的防灾减灾能力能够给予市政管线有效的保护。现阶段,我国关于综合管廊的抗震研究主要集中在P波和SV波,目前关于Rayleigh波作用下综合管廊的地震响应分析还比较少。由于综合管廊的浅埋特性,以及Rayleigh波的能量特性(在地