论文部分内容阅读
研究背景: 肺癌是危害人类生命健康最常见的恶性肿瘤之一,其发病率和病死率在全球大部分国家和地区均位居各类癌症之首。由于缺乏有效的早期诊断方法以及有效的治疗手段,肺癌的预后较差,其5年存活率不到20%。肺癌的科学防治已成为全球共同关注的热点和公共卫生问题。随着国家工业化进程、环境污染的不断加剧,我国人群肺癌的发病率和死亡率迅速增长,已超过世界的平均水平,且目前仍呈不断上升的趋势,严重威胁我国居民的生命健康。研究显示,吸烟是导致肺癌的最主要环境因素,80%肺癌的发生与吸烟有着重要的联系,但只有10%~15%吸烟者会得肺癌,且部分不吸烟者同样会因得肺癌而死亡,提示肺癌可能与个体遗传有关,遗传因素在肺癌的发生发展中起着重要作用。愈来愈多的证据显示,肺癌是一个多因素影响的复杂疾病,其发生是环境与遗传因素相互作用的结果。 微小RNA(microRNA,miRNA)是近年来发现的一类保守的、非编码小分子RNA,长度约22~24nt,通过与靶基因mRNA3’-非翻译区(3’-untranslated region,3’-UTR)的碱基互补配对,引起mRNA的降解或者翻译抑制,从而调节靶基因的表达水平。研究表明,miRNAs参与了细胞增殖、分化、凋亡以及肿瘤发生、侵袭等多种生理病理过程,尤其在肿瘤的发生发展中扮演着“癌基因”或者“抑癌基因”的类似角色。2002年研究者首次发现miRNAs有抑制肿瘤发生的作用,在大约68%的B细胞慢性淋巴白血病中,miR-15和miR-16存在缺失或下调;miR-15和miR-16可以负调控B细胞淋巴瘤2基因(B cell lymphoma2,BCL-2),而BCL-2是一种抗凋亡癌基因并在多种肿瘤中过表达,因此推测miR-15和miR-16起着抑癌基因的作用。Takamizawa等人首次发现在肺癌组织中miRNAs的表达异常。通过检测143个手术切除的肺癌组织标本中miRNAs的表达,发现miRNA let-7的表达降低与患者术后生存时间密切相关;体外实验证实把let-7导入肺腺癌细胞系A549后可以抑制肿瘤细胞的生长。Hayashita等人研究发现miR-17-92簇,包括hsa-miR-17-5p,hsa-miR-17-3p,hsa-miR-18a,has-miR-19a,hsa-miR-19b-1,hsa-miR-20a和hsa-miR-92,在肺癌中有显著的过表达,尤其是在小细胞肺癌组织中;把miR-17-92转染入A549细胞,能促进细胞增殖,而将其成员如miR-18a、miR-19a、miR-20a单独转染入A549中并不能促进细胞增殖,提示miR-17-92家族作为一个整体而发挥作用。Cho等通过miRNA微阵列分析发现,hsa-miR-126、hsa-miR-145、hsa-miR-21、hsa-miR-182、hsa-miR-183和hsa-miR-210在肺癌及正常组织中表达差异显著。最新一项研究显示,miR-193b在非小细胞肺癌(non-small cell lung cancer,NSCLC)中表达下调,在A549细胞中导入miR-193b可以抑制其生长、迁移和侵袭能力,且能抑制细胞周期蛋白D1和尿激酶型纤溶酶的活化。Markou等人发现,对于NSCLC病人的生存期,has-miR-21的过表达可作为一个独立的负性预后标志物。越来越多的证据显示了miRNAs的表达变化与各种肿瘤的关联。miRNAs家族已经被公认为基因表达调控网络中的关键成员,影响着信号转导通路中下游基因,尤其是肿瘤相关基因的功能。因此,通过对miRNAs在不同肿瘤的序列分析、特定表达水平、以及探讨肿瘤相关靶基因等有利于进一步认识miRNAs在疾病中的生物学作用。 单核苷酸多态性(single nucleotide polymorphism,SNP)是人类基因组最常见的遗传变异。大量的流行病学研究显示SNP改变可以影响肿瘤(包括肺癌)形成、侵袭、转移以及预后等过程。鉴于miRNA在基因调控网络中扮演的重要角色,位于miRNA基因序列的遗传变异是否会影响肿瘤的发生发展,也逐渐受到研究者的关注。已有文献报道,位于miRNA成熟体区域的遗传变异影响其自身加工成熟过程,亦可改变与相关靶基因的互补配对能力,从而导致不同的生物学效应。有研究发现,位于miR-125a成熟体的一个SNP(G>T)能阻碍pri-miR125a到pre-miR125a的转变,从而使成熟miR-125a表达下调;体外实验证实该SNP削弱了miR-125a与靶基因lin-28的结合能力,使其对lin-28的翻译抑制功能受限;而lin-28蛋白的过度积累可能会促进肝癌细胞的转化和侵袭。近年来越来越多的报道显示,miRNAs基因序列的遗传变异与肺癌的发病、治疗和预后等亦有密切的关系。miRNAs,作为一类新型的基因调节小分子,有望为阐明肺癌发病的具体生物学机制提供一条新的途径。 因此,我们经生物信息学分析,基于miRBase(18.0版本,截止至1/1/2012)和HapMap(HapMap Data Rel28 PhaseII+III,Auegest10,on NCBI B36 assembly,dbSNP b126,截止至1/1/2012)公共数据库网站,针对已报道的人类所有miRNAs,筛选出位于miRNA成熟体区域且在中国人群常见的SNPs位点(低发等位基因频率>0.05,minor allele frequency,MAF),并通过两中心大样本的病例对照研究,探讨miRNAs成熟体区域的遗传变异与肺癌易感性之间的关联,为肺癌预防、生物学标志物的筛选提供科学依据。 研究目的: 分析位于miRNA成熟体区域且是在中国人群中常见的遗传变异位点与人群肺癌发病的关联,探讨基因及基因-环境交互作用在肺癌发病中的作用,为肺癌高危人群或易感个体的筛选及肺癌的早期诊断和预防提供理论依据。 研究方法: 运用生物信息学系统分析,筛选出位于miRNA成熟体区域且是在中国人群中常见的多态位点;并通过广州-苏州两中心的病例-对照研究探讨这些多态位点与肺癌发病的关联。其中,广州地区人群作为发现关联的人群,包括1056例肺癌病例和1056例健康正常对照,苏州地区人群作为验证关联的人群,包括503例肺癌病例和623例健康对照。采用TaqMan技术检测所选取的多态位点的基因型,用SAS9.13统计软件分析人群的人口学特征、筛选出危险因素;采用非条件多因素Logistic回归模型,分析基因变异与肺癌发病的关联及“基因-环境”的交互作用。 研究结果: 1.1研究对象的人口学特征及单因素分析 广州地区1056例肺癌中,按病理类型分类,包括384例腺癌(36.4%),369例鳞癌(34.9%),43例大细胞肺癌(4.1%),128例小细胞肺癌(12.1%),132例为其他类型(如腺鳞癌、混合型肺癌,占12.5%);按病理分期I~IV期的比例分别为14.5%(154例)、9.0%(94例)、31.5%(333例)及45.0%(475例)。苏州地区503例肺癌患者中,包括231例腺癌(45.9%),158例鳞癌(31.4%),23例大细胞癌(4.6%),65例小细胞癌(12.9%),26例其他类型肺癌(5.2%);按病例分期,I期46例(9.2%),II期53例(10.5%),III期157例(31.2%),IV期247例(49.1%)。单因素分析显示,年龄、性别、肺癌家族史在广州、苏州地区人群病例和对照组的分布差异无统计学意义(P均>0.05);而饮酒、吸烟、年吸烟量在两中心人群的病例与对照组中则差异显著(广州人群:P值分别为0.042、0.028和0.000;苏州人群:P值分别为0.017、0.000和0.011),说明以上因素是肺癌发病的危险因素。 1.2 miRNAs成熟体区域的多态位点的生物信息学分析 miRNA公共数据库miRBase(http://mirbase.org,截止至1/1/2012)发布的人类miRNA序列信息,共1424个。经过生物信息学系统分析,位于miRNA成熟体区域的多态位点共有205个,其中在中国人群中常见(MAF>0.05)位点有5个,包括 hsa-mir-499(rs3746444T>C)、hsa-mir-608(rs4919510C>G)、 hsa-mir-3152(rs13299349G>A)、hsa-mir-4513(rs2168518G>A)、 hsa-mir-4520a(rs8078913T>C)。 1.3 miRNAs成熟体SNP与肺癌发病的关联分析 在广州人群对照组中,我们选取的5个单核甘酸多态位点的基因型频率均符合哈迪-温伯格平衡(Hardy-Weinberg Equilibrium,HWE)(P值均>0.05)。在广州地区人群中,我们发现miR-499 rs3746444T>C多态与肺癌发病风险相关。以携带TT野生基因型的个体为参照,携带变异基因型(CT+CC)的个体发生肺癌的风险增加34%(校正OR=1.34;95%CI=1.11-1.62);且rs3746444C等位基因变异数目与肺癌发病风险具有显著的剂量-反应关系(Ptrend=0.000)。上述关联在苏州地区人群验证中也得到一致的结果,携带rs3746444(CT+CC)变异基因型的个体发生肺癌的风险是携带TT野生基因型的1.38倍(校正OR=1.38;95%CI=1.07-1.80)。同质性检验显示两中心人群基因型分布一致(Breslow-Day检验,P=0.704),因此合并人群分析以增大检验效能。以rs3746444TT野生基因型个体为参照,CT杂合基因型的携带者患肺癌的风险是TT基因型携带者的1.19倍(校正OR=1.19;95%CI=1.01-1.40),而CC基因型的携带者则增加1.75倍(校正OR=2.75;95%CI=1.92-3.92);将变异C基因型(CT+CC)合并做二分类处理,rs3746444C变异基因型(CT+CC)的个体罹患肺癌危险性增加37%(校正OR=1.35;95%CI=1.16-1.57)。然而对于其他多态位点,未发现其基因频率和等位基因频率在病例和对照存在显著性差异(P均>0.05),提示这些位点可能与人群肺癌易感性无关联。 1.4分层分析 进一步分层分析发现,与携带 rs3746444TT基因型比较,携带 C变异基因型(CT+CC)的个体发生肺癌的危险性在无肺癌家族史、无肿瘤家族史的人群中更为显著(分别对应OR=1.36,95%CI=1.16-1.58;OR=1.35,95%CI=1.15-1.58),但同质性检验显示该位点变异基因型的危险遗传效应在各亚组间并无显著差异(P值分别为0.860和0.899)。 本研究创新之处 既往研究已报道部分miRNAs的遗传变异与人群肿瘤发病存在关联,但仅局限于已知的功能性 miRNAs。本课题首次通过生物信息学分析系统地筛选已报道的人类所有miRNAs成熟体序列的多态,在我国人群发现5个常见的SNP位点。进一步通过广州-苏州两中心人群的分子流行病学研究证实上述5个位点中 miR-499(rs3746444T>C)的遗传变异与我国人群肺癌发病存在显著关联。