论文部分内容阅读
[研究背景和目的]胃癌是世界上最常见的恶性肿瘤之一,也是世界第二大肿瘤相关的死亡病因,但是胃癌的发病机制还不明确。一些环境因素,如饮食习惯、吸烟、幽门螺杆菌,均可能影响胃上皮细胞的癌变过程,但仅有一部分暴露于这些环境因素的人会发生胃癌。这种现象提示人群的遗传易感性在胃癌的发病中起到至关重要的作用。粘蛋白是一族高度可变的、复杂的、高度糖基化的细胞外蛋白,它们的主要作用就是保持上皮的稳态。癌细胞分泌粘蛋白的数量和质量可能产生异常,而这些异常粘蛋白可能参与了肿瘤发生发展的过程。MUC5AC是一种分泌性粘蛋白,形成粘液附着在上皮表面。胃小凹上皮细胞分泌MUC5AC,而MUC5AC常作为胃小凹上皮细胞的标记进一步区分病理类型。MUC5AC表达水平的改变与胃癌的发生有关。调控区域功能性的基因多态性影响MUC5AC基因的表达,并可能影响人群胃癌的易感性。重复序列高密度分布于整个人类基因组中,它们的最突出特征为极不稳定、高度复杂多变,现在是基因研究的难点和盲区。重复序列是基因变异的主要动力,也是大片段基因演变和多态性的源泉。GWAS研究基本不能涵盖重复序列的基因变异,所以如何可靠的评价这种变异仍是一个巨大难题。我们通过研究MUC5AC上游的高度复杂重复序列调节区域,确定出一个复杂的重复区域(MUC5AC-u重复区域)。我们设计该胃癌对照研究以探索MUC5AC-u重复区域基因的多态性,并进一步分析该多态性与胃癌的发生发展之间的关系。[研究设计和方法]1.利用UCSC基因组浏览器(http://genome.ucsc.edu)和GRCh37/hg19人类基因组信息,生成关于MUC5AC基因主要基因组特征和位置的地图。其中包括乙酰化组蛋白H3赖氨酸27(histone H3lysine27acetylation,H3K27AC)状态、转录因子结合位点、常见单核苷酸多态和MUC5AC上游区域重复序列的基因组特征。MUC5AC上游区域的DNA序列从GRCh37和Ensemb(http://useast.ensembl.org/Homo_sapiens/Info/Index)官方网址下载。2.选取山东省立医院住院的230个胃癌患者作为胃癌组,并选取328个健康志愿者组成健康对照组。所有研究对象均为汉族人,病人之间且没有血缘和遗传关联。所有的研究对象均进行了问卷调查以获取他们的生物统计学资料以及胃癌相关环境危险因素的暴露情况,环境因素主要包括吸烟和饮酒的情况。通过不同渠道收集患者的所有可能的临床,病理资料和其他相关信息。胃癌患者的TNM分级按照WHO (World Health Organization)制定的标准进行。3.每一个研究对象均收集1ml外、周血,然后通过改良的盐析技术提取基因组DNA。其中36名胃癌患者,样本包括3部分:胃癌组织、癌旁组织(定义为肿瘤旁1.0cm处)、肿瘤周围正常胃粘膜组织。我们应用试剂盒(the Blood and Cell Culture DNA Mini Kit, Tiangen Biotech, Beijing, China)从不同组织中提取DNA。4.我们应用PCR (polymerase chain reaction)技术扩增MUC5AC-u重复区域。引物设计为:sense5’-TCCACCCTAACCCTGTCAGCCGC-3’; antisense5’-GTGGCAGGAGTGTGGGGAAAGG G-3’。 PCR反应体系为50μL,包括100ng基因组DNA,0.2μM引物和25μL PrimeSTAR Max DNA Polymerase (Takara, Japan)。PCR仪的型号9700Thermacycler(Perkin-Elmer, CA, USA), PCR条件和步骤如下:94℃变性5分钟,然后98℃,10秒30个循环,最后68。C,2分钟。5.为了进一步确定PCR扩增的可靠性,我们选取了典型PCR扩增DNA样本,做进一步纯化和测序。6.应用SPSS13.0(SPSS, Chicago, IL, USA)进行统计学分析。[研究结果]1.研究发现在MUC5AC上游-3162到-1452之间存在一个复杂的1710bp的重复区域(我们命名为MUC5AC-u重复区域,MUC5AC-u repetitive region),我们确定该区域开始于ATG起始密码子紧邻上游。MUC5AC-u重复区域是由微卫星(microsatellite,比如CTCA)、小卫星(minisatellite,比如CATTCACT或CATTCACTCATT)、大卫星(megasatellite比如ACCCATTCACTCACTCACTTATTCACTC)组成的复杂的重复序列。在该区域的5’起始侧,我们发现了一个长度为300bp的的由头到尾的完整可复制重复序列。2.该研究中的所有个体(328个无肿瘤对照和230个胃癌患者)都来自中国汉族人群并且没有任何已知的遗传疾病。对照跟胃癌组的年龄性别分布相似,胃癌患者与对照之间的吸烟和酒精饮用情况也没有显著统计学差异。TNM分级情况分别有10.9%,10.0%,21.7%,42.2%和15.2%的患者被分为0,Ⅰ,Ⅱ,Ⅲ和Ⅳ级胃癌。3.本研究中我们总共发现了8种等位基因,大小在1.1到2.8kb之间,其中1.1kb等位基因最为常见,其次是1.8和2.0kb等位基因,其他的5种等位基因则相对少见。胃癌患者MUC5AC-u重复区域等位基因的总体分布与对照相比存在显著统计学差异(χ2=58.44,p=3.09×10-1)。胃癌患者基因型中1.4和1.8kb等位基因出现的频率较对照明显增高(3.9%vs.0.0%,pc=3.00×10-6;35.4%vs.25.8%,pc=1.56×10-2)。而胃癌患者基因型中2.3和2.8kb等位基因出现的频率较对照明显低(3.3%vs.9.0%,p=1.51×10-4:0.0%vs.1.8%,p=0.002),经过多重比较校正后的P值分别为:2.3kb的pc=4.68×10-3;2.8kb的pc=0.062。其他等位基因的出现频率在胃癌患者与对照之间比较未发现显著统计学差异。基于以上这些观察,我们把八个等位基因分为三组:致病作用组(S组,susceptible group)、保护作用组(P组,protective group)、无表型相关组(N组,null with respect to risk group).S组包括1.4和1.8kb等位基因;P组包括2.3和2.8kb等位基因;N组包括其他的等位基因。在所有的患者以及对照中我们定义了21个MUC5AC-u重复区域组合基因型(详见表S3所示)。这些基因型同样分为NN,SN,PN,SP,SS组,在我们的研究中,可能是由于样本不够大的原因,未发现PP基因型。我们把最常见基因型,也就是NN型作为对照组做进一步相关分析。结果显示携带纯合子的个体,也就是SS基因型,发生胃癌的风险较NN组高2.7倍(OR=2.683.95%CI=1.554-4.361,pc=0.012;表2);PN基因型较NN基因型发生胃癌的危险度明显降低(OR=0.257,95%CI=0.116-0.569,pc=0.031).而SN和SP基因型与NN基因型相比较发生胃癌的风险没有显著统计学差异(p>0.05)。4.15个胃癌患者携带着1.4kb等位基因,他们中有三个是纯合子,其余的则是杂合子。与不携带1.4kb等位基因的胃癌患者相比,携带一条1.4kb等位基因或以上的胃癌患者发病年龄更年轻(<50岁)并且具有更高的TNM分级(T4M1)(分别为66.7%vs.17.2%,p=4.37×10-6;93.3%vs.58.6%,p=0.006:53.3%vs.12.6%,p=2.13×10-5;其对应的pc值=1.35×10-4,0.186和6.60×10-4)。128例(55.7%)胃癌患者携带1.8kb等位基因,其中35个是纯合子。与杂合子以及不携带1.8kb等位基因的胃癌患者相比,纯合子倾向于更高的发病年龄(≥50岁),更低的TNM(T3N0,stage0-Ⅱ)分级(分别为5.7%vs.23.1%,p=0.021;60.0%vs.35.4%,p=0.006;51.4%vs.29.2%,p=0.010;68.6%vs.37.9%,p=7.43×10-4)。这些P值虽然小于0.05,但在Bonferroni校正后失去了显著统计学差异。5.本研究没有发现36名胃癌患者的肿瘤旁组织以及肿瘤周围的正常胃粘膜组织的MUC5AC-u重复区域的长度多态存在显著差别,但有2名患者的胃癌组织的MUC5AC-u重复区域的长度多态不同于肿瘤旁组织以及肿瘤周围的正常胃粘膜组织。从这两例患者的情况我们发现,胃癌组织MUC5AC-u重复区域的长度多态倾向于由长基因型向短基因型演变。其中一个患者基因型由2.0kb等位基因转变成了新型0.9kb等位基因;而另一个患者基因型由2.3kb等位基因转变成了1.4kb等位基因。在所研究的36个胃癌患者中,MUC5AC-u重复区域肿瘤相关基因重组的几率为5.6%。6.应用Sanger测序技术,我们成功的完成了胃癌组织MUC5AC-u重复区域1.1kb和1.4kb典型等位基因的完整测序工作。这些序列具有相同的主要基因结构和重复单位但却有不同的长度多态性。与胃癌组织MUC5AC-u重复区域1.1kb等位基因相比,1.4kb等位基因的5’端多出一个长度为300bp的完整串联复制片断。由于目标区域复杂重复的结构特点和技术本身的局限性,我们没能得到胃癌组织MUC5AC-u重复区域1.8kb和大于1.8kb等位基因的完整可靠序列。[结论]本研究分析了230个胃癌患者以及328个健康对照的MUC5AC上游启动子附近区域,并进一步分析了此复杂重复区域的长度多态性与胃癌的之间的关系。230个胃癌患者和328个健康对照者中,共发现1.1kb,1.4kb,1.8kb,2.0kb,2.1kb,2.3kb,2.5kb和2.8kb八个等位基因表型,其中1.4和1.8kb等位基因在胃癌组更加常见,而2.3和2.8kb等位基因在健康对照组更为常见。与胃癌未侵润的正常胃粘膜组织相比较,有2例胃癌组织发生了重复区域片断丢失的变异相对于PN基因型,SS基因型个体发生胃癌的风险高2.7倍;携带单拷贝或双拷贝1.4kb等位基因的胃癌个体表现出更早的胃癌发病年龄和更高的转移分期(Bonferroni矫正p=1.35×10-4和6.60×10-4);携带2个1.8kb等位基因的纯合子患者具有更低的TNM分级。该研究表明MUC5AC的上游重复区域的多态性与胃癌的发生以及进展有一定的相关性。