论文部分内容阅读
乳腺癌是女性最常见的恶性肿瘤,约占所有恶性肿瘤的23%。无论是在发达国家还是发展中国家,乳腺癌的发病率和死亡率均位于女性恶性肿瘤的首位。我国虽然属于乳腺癌的低发病区,但近年来乳腺癌的发病率呈快速增长的趋势,成为威胁我国女性健康的重大疾病之一。对于乳腺癌的确切病因尚不清楚,目前认为乳腺癌的发生发展是环境与遗传因素共同作用的结果。不同遗传背景的个体在相同的环境暴露下其发生乳腺癌的危险性不同,提示遗传背景的差异可能影响个体对乳腺癌的易感性。这种遗传背景的差异在一般人群中主要表现为基因组序列的差异,包括单核苷酸多态性(Single Nucleotide Polymorphisms,SNPs)。因此,识别乳腺癌易感基因是鉴别乳腺癌高危人群的关键。目前已经确定的乳腺癌高共显性基因包括乳腺癌易感基因1(breast cancer 1 gene,BRCA1)、乳腺癌易感基因2(breast cancer 2 gene,BRCA2)和共济失调毛细血管扩张症突变基因(ataxia-telangiectasia mutated gene,ATM)等,但是这些高共显性基因的突变仅仅解释了5%左右的乳腺癌发病,提示我们另外一些遗传变异在乳腺癌的发生发展中也起着重要的作用。进化保守性(Evolutionary conservation)是鉴定人类基因组中具有重要功能的基因序列和元件的强有力的工具。2004年,Bejerano等人发现在人、小鼠和大鼠基因组的直系同源区域中共有481条长度超过200bp,不编码蛋白质的高度保守序列,其序列一致性达100%。他们称这些序列为非编码超保守元件(Ultraconserved elements,UCEs)。UCEs在生物进化过程中一直存在并已超过了三亿年,这样的高度保守性从某种程度上意味着一定的功能性。目前有许多研究表明UCEs在脊椎动物基因组中发挥着重要的功能,例如有的可以作为增强子进行远距离基因表达调控,有的能调节剪接作用和表观修饰作用,还有的能发挥转录协同作用。最近几年,相关的研究关注到人类基因组中的这些非编码超保守元件在各种肿瘤细胞中具有不同的表达特性,另外它们通常位于染色体的“脆性位点”以及与肿瘤相关的区域内,并且与miRNA有着一定的关联,所以UCEs可能与肿瘤之间存在关联。尽管UCEs具有超高的保守性,但它们并非突变率降低或是突变的冷位点,Bejerano等研究者在481个UCEs中检测出了6个多态性位点。随后Yang等人基于这6个SNPs位点,于2008年在德国人群中进行了一项乳腺癌关联研究,结果发现rs2056116和rs9572903两个位点与家族性乳腺癌风险存在着统计学上的关联。迄今为止,关于UCEs多态性研究的报道屈指可数,并且尚未出现UCEs区域多态性与中国人群乳腺癌遗传易感性研究的报道。尽管Bejerano等人于2004年报道了481个UCEs上有6个多态性位点,但随着NCBI dbSNP数据库的更新,我们有必要对UCEs上的多态性位点进行更全面的分析和检测。因此,我们的研究假设是:UCEs区域是乳腺癌的遗传易感区域,这些区域单核甘酸多态性(SNPs)与中国人群乳腺癌发病风险存在关联。基于上述假设,我们首先在http://users.soe.ucsc.edu/~jill/ultra.watson.fa网站上获取到481条UCEs的序列信息,然后利用NCBI的dbSNP数据库(Build 131)对中国汉族人群中的481条UCEs上常见SNPs进行筛选,即选出所有最小等位基因频率大于5%(MAF>0.05)的SNPs位点。最后,我们共挑选出7个多态位点,分别是位于uc.51、uc.82、uc.133、uc.140、uc.302、uc.353和uc.368上的rs17049105 A>G、rs13020355 T>C、rs2682406 T>A、rs2056116 A>G、rs11190870 T>C、rs9572903 A>G以及rs8004379 A>C位点。随后,我们采用两阶段病例-对照研究设计:第一阶段采用735例乳腺癌病例和735例对照进行初筛,第二阶段采用762例病例和762例对照进行独立验证,来探讨UCEs区域单核苷酸多态性与中国人群乳腺癌遗传易感性的关系。其中病例是经病理组织学确诊的乳腺癌新发病例,对照是年龄和地区与病例所匹配的无肿瘤病史的社区对照。应用TaqMan基因分型技术进行基因型检测并进行相关统计分析。研究结果显示:第一阶段,七个多态性位点(rs17049105、rs13020355、rs2682406、rs2056116、rs11190870、rs9572903和rs8004379)的各种基因型在病例组和对照组中的分布均不存在显著差异(P值分别为0.96、0.63、0.43、0.29、0.63、0.87和0.06)。logistic回归分析显示:在调整年龄、初潮年龄和绝经状态等因素后,与野生纯合基因型AA相比,rs8004379 A>C位点的杂合基因型AC可以显著增加个体乳腺癌患病风险(AC vs. AA:调整OR = 1.38,95% CI = 1.09-1.75);此外,显性模型显示该位点的联合变异基因型AC/CC与野生纯合型AA相比亦可以显著增加乳腺癌患病风险(AC/CC vs. AA:调整OR = 1.30,95% CI = 1.04-1.63)。我们没有发现其余6个位点与乳腺癌患病风险存在显著关联。随后,我们基于第一阶段各个位点的基因型在病例和对照中分布频率的差异所得到的P值,选择了P值最小的rs8004379 A>C和rs2056116A>G两个位点纳入第二阶段进行验证。多因素logistic回归分析显示:在调整年龄、初潮年龄和绝经状态等因素后,与野生纯合基因型相比,两个位点的变异基因型与乳腺癌患病风险均不存在显著关联(rs8004379 A>C:AC vs. AA:调整OR = 1.05,95% CI = 0.83-1.31,CC vs. AA:调整OR = 0.99,95% CI = 0.69-1.19;rs2056116A>G:AG vs. AA:调整OR = 1.20,95% CI = 0.95-1.50,GG vs. AA:调整OR = 1.12,95% CI = 0.77-1.63)。显性模型也未发现两位点的变异基因型与乳腺癌患病风险存在显著关联(rs8004379 AC/CC vs. AA:调整OR = 0.75,95% CI = 0.84-1.29;rs2056116 AG/GG vs. AA:调整OR = 1.18,95% CI =0.95-1.47)。两阶段合并后分析显示:在调整年龄、初潮年龄和绝经状态等因素后,与野生纯合基因型AA相比,rs8004379 A>C位点的AC基因型可以显著增加个体乳腺癌的患病风险(AC vs. AA:调整OR = 1.20,95% CI = 1.01-1.40);但显性模型显示该位点的联合变异基因型AC/CC与乳腺癌患病风险之间的关联未达到统计学显著性水平(AC/CC vs. AA:调整OR = 1.16,95% CI = 0.99-1.35)。此外,我们没有发现rs2056116A>G位点与乳腺癌患病风险存在显著关联。基于显性模型,我们对rs8004379 A>C位点和rs2056116A>G位点按照年龄、初潮年龄、绝经状态、首胎活产年龄、一级亲属肿瘤家族史及ER(雌激素受体)/PR(孕激素受体)状态进行了分层分析,结果显示各层均未发现这两个位点与乳腺癌患病风险存在显著关联。在这项研究中,我们首次在中国人群中探讨了UCEs单核苷酸多态性与乳腺癌患病风险的关联,研究结果表明UCEs上的7个SNPs位点在中国汉族人群中与乳腺癌均不存在显著性关联。