论文部分内容阅读
癌症“重男轻女”现象被人们关注已久,根据流行病学统计数据,男性罹患癌症的风险和癌症死亡风险均高于女性,并且这种差异还表现在患者诊断、预后以及体内药物代谢差异上。对此现象,目前存在男女患者护理差异、累积细胞分裂系数差异和性激素/激素受体表达差别等多种不同角度的解释,这些解释观点通常只关注单一的肿瘤或者是基于流行统计的回顾分析,因此我们利用TCGA数据库公开的高通量测序组学数据,挖掘泛癌中的性别差异分子特征,为癌症中广泛存在的性别差异现象提供分子依据。我们先根据对膀胱癌的初步分析探讨思路和方法,采用倾向评分方法减少协变量对分析结果的影响,以转录组数据为探讨性别差异的分析入口。根据全球癌症统计年刊公布的男女患者死亡风险比率,我们从TCGA数据库挑选出具有明显性别差异的13类癌症作为研究对象,分析性激素受体基因在男女间的表达差异,随后使用遗传算法结合支持向量机的方法,挑选出能最大程度解释患者性别差异的性别特征基因,为了寻找调控因素,我们进一步对性别特征基因进行了甲基化分析。我们发现性激素受体在TCGA的对照样本间并未表现出性别差异表达,在13类癌症中,只有肾乳头状细胞癌和肝细胞癌患者存在黄体素受体的性别差异表达。通过比较分类效果,我们发现基于遗传算法挑选的性别特征基因比统计最显著的基因更能区分患者的性别标签。同时我们发现了受甲基化调控影响的癌基因DDX43,其在膀胱癌,肺鳞状细胞癌,皮肤黑色素瘤以及直肠腺癌中均表现出男性患者平均高表达的特征,这与这四类肿瘤偏发于男性的现象相符。相比女性患者,癌基因DDX43启动子的平均甲基化程度在男性患者中更低,由于基因的启动子高甲基化可以抑制该基因的转录表达,因此这可能是影响癌症中性别差异的因素之一。同时我们还在特征基因中发现了参与药物代谢的基因,这可能与男女患者间药物代谢率不同有关联。