论文部分内容阅读
在某一特定类型的人类正常组织样本内,基因表达水平的相对高低秩序(relative expression orderings,REOs)关系,即转录组定性特征,存在广泛的稳定性,而在其相应的癌症组织样本中却发生了广泛的扰动。基于这一生物学现象,我们实验室已经开发几个基于REOs的分析算法,如用于识别个体化水平的差异表达基因的RankComp算法,利用单边数据识别疾病相关通路的DRFunc算法等。在这类方法中,通常都是筛选出基因表达的秩序关系在正常组织样本中显著稳定的基因对,利用其作为正常背景,然后通过癌症组织样本中的基因对与这个正常背景比较,进行相关分析。REOs具有对实验批次效应不敏感、可以整合不同来源的数据,因此可以重复利用以往研究累积的样本等优点。然而,目前尚没有研究分析如年龄、性别、种族以及吸烟等混杂因素对正常组织样本中REOs的影响。在本研究中,我们搜集来自三个独立数据集的173例肺正常组织样本,用于评价混杂因素对REOs的影响。对于年龄因素,我们采用秩和检验筛选与年龄相关的基因对。其他三个因素,首先,利用二项累积分布分别在两类样本中筛选显著稳定的基因对,然后比较这两类样本中基因对的秩序模式。最后,基于两类样本中具有相反秩序模式的基因对,利用RankCompV2算法识别哪些基因的差异表达导致了这些基因对秩序模式的逆转,并进行通路富集分析。对于年龄因素,我们没有筛选到相关的显著稳定基因对。对于性别因素,在女性肺正常组织样本中显著稳定的基因对中,约有0.074%的基因对在男性肺正常组织样本中的秩序关系相反。同时,我们识别了24个导致这些基因对的秩序关系逆转的差异表达基因,其中有19个位于性染色体上:7个在男性肺正常组织中相对于女性样本高表达的基因有6个基因位于Y染色体上,一个基因位于X染色体;而12个在女性样本中高表达的基因都位于X染色体上的基因。另外,还有5个基因位于常染色体上,其中3个在男性样本中高表达的基因为PRDM7、DDX43和CRISP2,并且DDX43和CRISP2与精子生成过程相关。另2个相对于男性肺正常组织,在女性肺正常组织中高表达的基因为NLRP2和C3orf79。其中,NLRP2位于19号染色体长臂1区3带,是卵子质量的重要调控者。此外,我们还发现在胃正常组织和食管正常组织中,性别因素对其样本内的REOs同样具有一定的影响。对于种族因素,在白种人的肺正常组织中显著稳定的基因对中,有0.027%的基因对在黑种人的肺正常组织样本中秩序关系相反。同样,我们识别了22个引起这些秩序关系逆转的差异表达基因,并发现这些基因显著富集于戊糖和葡萄糖醛酸转换(Pentose and glucuronate interconversions)、果糖和甘露糖代谢(Fructose and mannose metabolism)、甘氨酸、丝氨酸和苏氨酸代谢(Glycine,serine and threonine metabolism)、氨基酸的生物合成(Biosynthesis of amino acids)以及碳代谢(Carbon metabolism)等代谢相关通路,还有与免疫相关的抗原加工提呈(Antigen processing and presentation),补体途径(Complement and coagulation cascades)和IgA产生的肠道免疫网络(Intestinal immune network for IgA production)通路。在非吸烟者肺正常组织中显著稳定的基因对中,约有0.23%在吸烟者的肺正常组织中的秩序关系出现逆转。然后,我们识别出344个引起这些秩序关系逆转的差异表达基因,并发现其中在吸烟者肺组织中上调的基因显著富集于细胞色素P450异物代谢(Metabolism of xenobiotics by cytochrome P450)、谷胱甘肽代谢(Glutathione metabolism)、甾类激素生物合成(Steroid hormone biosynthesis)、甲状腺激素的合成(Thyroid hormone synthesis)、铁死亡(Ferroptosis)、碳代谢(Carbon metabolism)以及ABC转运子(ABC transporters)等生物学通路;在吸烟者肺组织中下调的基因显著富集于矿质元素吸收(Mineral absorption)和烟酸和烟酰胺代谢(Nicotinate and nicotinamide metabolism)等生物学通路(超几何检验,p<0.05),提示吸烟因素可能影响了这些重要的生物学通路功能。综上所述,吸烟因素对肺正常组织样本内REOs的影响最大,性别因素次之,种族因素影响较小,没有发现年龄因素对基因表达的秩序关系有影响。此外,性别因素对胃正常组织和食管正常组织样本内的REOs同样具有一定的影响。总之,基于REOs的研究应该考虑吸烟,性别以及种族这些混杂因素的影响。