论文部分内容阅读
研究背景:
在世界范围内,乳腺癌是女性最常见的恶性肿瘤。乳腺癌发病率和死亡率的信息对于规划卫生措施至关重要。从人民健康及卫生保健投入资金成本来讲,所有国家都建议妇女接受教育,以便及早发现和尽早治疗。控制和预防乳腺癌的计划必须是卫生政策制定者的一个高度优先事项。目前认为乳腺癌的发生是遗传和非遗传因素交互作用的结果。现在研究已经表明乳腺癌是具有家族遗传倾向的,与遗传易感基因包含的遗传背景密切相关。
全基因组关联性研究(Genome-wide association study, GWAS)近年来十分广泛,越来越多的基因变量被证实与乳腺癌相关,来自亚洲人群的研究也日趋增多。但由于人种的差别以及连锁不平衡的模式在种族之间存在差异,不同人种和地区与乳腺癌相关的单核苷酸多态性(single nucleotide polymorphisms, SNPs)位点亦不相同。SNPs是指在正常人群中,DNA(deoxyribonucleic acid)某个基因座位上两个互相替换的碱基出现的频率如果分别超过1/100,那么该位点即为该基因的单核苷酸多态性位点。当前的研究结果提示许多基因的SNPs与乳腺癌的分型、新辅助化疗的反应以及患者的预后有着很大的关联性。SNPs能够被遗传、被检测,还能筛选出致病基因并进行验证,进一步开展致病机制的探索,在人类疾病与人类本身的基因构成之间架起桥梁,能够让人类对疾病或者人类本身有更加深入的了解。尽管随着治疗方式或模式的不断更新和新药的不断研发,早期乳腺癌的5年无病生存率(disease free survival, DFS)已经得到了很大的提高,但随着随访时间的延长,尽管他们接受了标准、规范的治疗,仍有患者不可避免的出现复发或转移。传统的临床病理预后指标包括肿瘤的大小、淋巴结受累情况、肿瘤的分级、患者的年龄、雌激素受体、孕激素受体、HER2状态、Ki67等,但仍然未能完全预测患者的预后,从精准医学的角度出发,需要探讨遗传学或者基因学变量对乳腺癌的预后生存方面的影响或者贡献,而这方面目前我们知之甚少。
本研究的目的在于选择已在欧洲和亚洲人群中发现的与乳腺癌相关的SNPs位点,进一步验证其在本地区汉族女性乳腺癌人群中的遗传易感性。同时将传统常用的临床病理指标、所选SNPs位点信息与该地区乳腺癌患者生存信息相匹配,分析所选SNPs与该地区乳腺癌患者预后生存的关系,进而从基因学的角度判断乳腺癌患者的预后情况,并将所筛选出来的位点基因在数据库中进行生物信息学分析,构建该基因参与乳腺癌调控的网络通路。
材料与方法:
1.研究人群:本研究以2014年01月~2014年05月在郑州大学附属肿瘤医院收治的本地区汉族女性乳腺癌患者为病例组,共计254例,年龄18~79岁,中位年龄:46岁,诊断之前未接受化疗或放疗;以同期在本院收治的乳腺良性病变患者作为健康对照组,共计339例,年龄18~72岁,中位年龄:43岁。病例组有22例患者为导管原位癌或乳头派杰氏病,在232例浸润性导管癌患者中,有6例患者初次诊断时就确诊为远处转移,2例患者临床信息部分缺失,147例(63.4%)患者为绝经前状态。19例患者接受了新辅助化疗,177例患者接受了辅助化疗或解救化疗。所有入组人员均无其他恶性肿瘤病史、家族遗传病病史及其家族中无恶性肿瘤患者,并且均为没有血缘关系的本地区汉族女性。纳入分析的乳腺癌患者均有病理证实及发病年龄、月经状态、临床分期、分子分型、DFS等资料。
2.SNPs的选取、分型及质控:在本研究中,我们在HapMap数据库(http//www.hapmap.org)的北京汉族人群中筛选出等位基因频率>5%的SNPs。同时匹配在PubMed、Embase、中国知网、维普、万方数据库及中国生物医学文献数据库中以中文检索词“单核苷酸多态性”、“乳腺癌”、“激素受体状态”、“分子分型”、“预后”以及英文检索词“SNPs”、“breastcancer”、“ER”、“PR”、“subtypesofbreastcancer”、“prognosis”、“GWAS”为关键词检索中外文献报道的,已经在欧洲及亚洲人群中通过GWAS发现与乳腺癌的发病风险、临床病理特征、预后生存相关的SNPs位点。最终确定了rs10069690(TERT)、rs2046210(6q25.1 )、rs2981582(FGFR2)、rs889312(MAP3K1)、rs3803662(TOX3/TNRC9)五个位点[1,2,3,4,5]作为基因分型对象,采用天根基因公司全血基因组DNA抽提试剂盒抽提研究对象外周血的基因组DNA(deoxyribonucleic acid),测得DNA标本浓度及纯度。使用改进的多重高温连接酶检测反应(improved multiple high temperature ligase detection reaction,iMLDR )技术对rs10069690(TERT)、rs2046210(6q25.1)、rs2981582(FGFR2)、rs889312(MAP3K1)、rs3803662(TOX3/TNRC9)进行基因位点分型。基因位点分型是通过盲法的方式进行,基因位点分型的可重复性达100%。按照国际通用的免疫组化分型方法,雌激素受体(estrogen receptor,ER)、孕激素受体(progesterone receptor,PR)、人类表皮生长因子受体2(human epidermal growth factor receptor 2,HER2)、Ki67四个免疫组化指标将乳腺癌分为五种类型:LuminalA、LuminalB、LuminalHER2、HER2-enrich、三阴性乳腺癌(triple negative breast cancer,TNBC)。其中ER、PR阳性的判读标准为>1%,HER2基因过表达定义为免疫组化(immunohistochemical,IHC)检测HER2(3+)或荧光原位杂交(Fluorescence in situ hybridization,FISH)检测提示HER2基因扩增。LuminalA型定义为:ER、PR均为阳性,HER2阴性,且Ki67≤14%,PR>20%。LuminalB型定义为:ER或PR阳性,HER2阴性,且Ki67>14%。HER2-enrich型定义为:ER、PR均为阴性,且HER2阳性;LuminalHER2型定义为ER或PR阳性,且HER2阳性;TNBC定义为ER、PR均为阴性,且HER2阴性。
3.DFS定义为从疾病确诊至疾病复发或死亡的时间,包括区域复发(同侧胸壁或乳腺、双侧腋窝及双侧锁骨上下区、对侧乳腺)、第二原发恶性肿瘤、远处转移及任何疾病复发导致的死亡、随访终止时间。
4.月经状态的判断绝经后包含以下任何一种情况:1)既往接受过双侧卵巢切除术;2)年龄≥60岁;3)年龄<60岁并且在没有接受化疗、他莫西芬、托瑞米芬或卵巢功能抑制的情况下一年或者超过一年没有月经,并且促性腺激素释放激素(follicle-stimulating hormone,FSH)和雌二醇水平在绝经水平范围内;4)如果接受了他莫西芬或者托瑞米芬的治疗,同时年龄<60岁,FSH和血清雌二醇水平在绝经水平范围内。
5.随访时间本研究的随访时间从患者病理确诊时间开始,2017年12月31日为随访截止时间。随访方式为电话随访及门诊随访。随访内容包括患者生活状态、最近一次体格检查及辅助检查结果(彩超、钼靶、CT、全身骨显像或MRI)、当前治疗状态。
6.统计学分析:分别计算病例组与对照组SNPs位点的基因型分布频率,判断对照组是否符合Hardy-Weinberg平衡定律;应用SPSS20.0版统计建立数据库,运用卡方检验检测SNPs位点基因型在病例组及对照组分布是否有差异。运用非条件logistic回归分析计算比值比(odds ratio , OR )及95%置信区间(confidence interval,CI),评估不同SNPs位点的遗传模型与乳腺癌的发病风险。用均数±标准差表示计量资料的数据资料,频数及百分比表示计数资料的数据资料。方差分析用来比较计量资料之间的差异,判断SNPs位点的等位基因型在乳腺癌患者的发病年龄分布上是否有差异。计数资料的组间比较采用卡方检验,判断SNPs位点的等位基因型在肿瘤大小、淋巴结转移数目、激素受体状态、月经状态、免疫分型中是否存在差异;进一步采用单因素的logistic回归分析确定SNPs位点的基因型与临床病理特征的关系。定量资料与计数资料的相关分析应用Spearman分析。生存分析应用Kaplan-Meier分析及log-rank检验,判断发病年龄、肿瘤大小、淋巴结转移数目、免疫分型、月经状态以及SNPs位点的等位基因型是否与乳腺癌患者DFS有相关性。采用COX比例风险回归模型分析多个因素对乳腺癌患者DFS的影响。设定P<0.05为差异有统计学意义。
7.筛选出人群特异性位点后,选定相关基因,通过查阅乳腺癌相关文献资料,并对该基因进行分析和整合,进行GO功能注释以及KEGG分析,构建基因参与的乳腺癌相关基因的调控网络模型,并利用贝叶斯算法对网络模型进一步优化,最终找出基因调控乳腺癌细胞增殖的最大可能路径。
研究结果:
1.最终的分析包括254例乳腺癌病例和339名对照组成员。其中来自病例组及对照组各有一个样本无法进行rs10069690(TERT)基因型分型。Rs10069690(TERT)、rs2046210(6q25.1)、rs2981582(FGFR2)、rs889312(MAP3K1)的基因型在病例组与对照组中的分布没有统计学差异(P值分别为:0.772,0.308,0.376,0.468),而rs3803662(TOX3/TNRC9)的基因型在病例组与对照组中的分布具有显著性统计学差异(P=0.044)。在共显性遗传模型(OR=2.17,95%CI:1.18-4.00)及隐性遗传模型(OR=2.04,95%CI:1.14-3.66)中,与AA、GA相比,等位基因型GG显著增加了乳腺癌的患病风险(P值分别为:0.013,0.017)。
2.在临床病理特征与SNPs位点的相关性分析中,rs889312(MAP3K1)与肿瘤大小、激素受体状态的表达有显著相关性(P值分别为0.018,0.043),其中等位基因型AA与激素受体状态阳性有相关(P=0.014)。而rs10069690(TERT)、rs2046210(6q25.1)、rs2981582(FGFR2)、rs3803662(TOX3/TNRC9)与发病年龄、肿瘤大小、淋巴结转移数目、激素受体状态、月经状态、分子分型均无明显相关性(P值均>0.05)
3.在Kplan-Meier生存分析中,携带rs3803662(TOX3/TNRC9)不同基因型乳腺癌患者的DFS有显著性统计学差异(P=0.010),其中携带rs3803662等位基因型GG的乳腺癌患者有着更短的DFS。而携带rs10069690(TERT)、rs2046210(6q25.1)、rs2981582(FGFR2)、rs889312(MAP3K1)不同基因型乳腺癌患者的DFS无显著性统计学差异(P值分别为0.202,0.096,0.686,0.172)。
4.在COX比例风险回归模型分析中,矫正了年龄、肿瘤大小、淋巴结转移数目、分子分型等因素,结果显示与rs3803662(TOX3/TNRC9)的等位基因型GA/AA相比,GG型显著增加乳腺癌的复发或死亡风险[P=0.021,HR=3.065(95%CI:1.183-7.941)]。
5.GO分析结果提示rs3803662位点相关基因TOX3/TNRC9具有生物过程、分子功能和细胞组分三种功能,结合KEGG信号通路数据库得出乳腺癌相关基因调控网络图,经贝叶斯定理优化后筛选出TOX3/TNRC9参与的乳腺癌细胞调控网络的最优路径。
结论:
1.Rs3803662(TOX3/TNRC9)与本地区汉族女性乳腺癌的发病风险相关,且等位基因型GG增加了乳腺癌的患病风险。
2.Rs3803662(TOX3/TNRC9)是本地区汉族女性乳腺癌患者的独立预后因素,该位点是判断本地区汉族女性乳腺癌患者预后的重要位点。
3.初步建立TOX3/TNRC9基因参与的乳腺癌相关基因的初级调控网络模型,ER---TOX3/TNRC9是本网络肿瘤细胞增殖的最佳可能作用路径。
在世界范围内,乳腺癌是女性最常见的恶性肿瘤。乳腺癌发病率和死亡率的信息对于规划卫生措施至关重要。从人民健康及卫生保健投入资金成本来讲,所有国家都建议妇女接受教育,以便及早发现和尽早治疗。控制和预防乳腺癌的计划必须是卫生政策制定者的一个高度优先事项。目前认为乳腺癌的发生是遗传和非遗传因素交互作用的结果。现在研究已经表明乳腺癌是具有家族遗传倾向的,与遗传易感基因包含的遗传背景密切相关。
全基因组关联性研究(Genome-wide association study, GWAS)近年来十分广泛,越来越多的基因变量被证实与乳腺癌相关,来自亚洲人群的研究也日趋增多。但由于人种的差别以及连锁不平衡的模式在种族之间存在差异,不同人种和地区与乳腺癌相关的单核苷酸多态性(single nucleotide polymorphisms, SNPs)位点亦不相同。SNPs是指在正常人群中,DNA(deoxyribonucleic acid)某个基因座位上两个互相替换的碱基出现的频率如果分别超过1/100,那么该位点即为该基因的单核苷酸多态性位点。当前的研究结果提示许多基因的SNPs与乳腺癌的分型、新辅助化疗的反应以及患者的预后有着很大的关联性。SNPs能够被遗传、被检测,还能筛选出致病基因并进行验证,进一步开展致病机制的探索,在人类疾病与人类本身的基因构成之间架起桥梁,能够让人类对疾病或者人类本身有更加深入的了解。尽管随着治疗方式或模式的不断更新和新药的不断研发,早期乳腺癌的5年无病生存率(disease free survival, DFS)已经得到了很大的提高,但随着随访时间的延长,尽管他们接受了标准、规范的治疗,仍有患者不可避免的出现复发或转移。传统的临床病理预后指标包括肿瘤的大小、淋巴结受累情况、肿瘤的分级、患者的年龄、雌激素受体、孕激素受体、HER2状态、Ki67等,但仍然未能完全预测患者的预后,从精准医学的角度出发,需要探讨遗传学或者基因学变量对乳腺癌的预后生存方面的影响或者贡献,而这方面目前我们知之甚少。
本研究的目的在于选择已在欧洲和亚洲人群中发现的与乳腺癌相关的SNPs位点,进一步验证其在本地区汉族女性乳腺癌人群中的遗传易感性。同时将传统常用的临床病理指标、所选SNPs位点信息与该地区乳腺癌患者生存信息相匹配,分析所选SNPs与该地区乳腺癌患者预后生存的关系,进而从基因学的角度判断乳腺癌患者的预后情况,并将所筛选出来的位点基因在数据库中进行生物信息学分析,构建该基因参与乳腺癌调控的网络通路。
材料与方法:
1.研究人群:本研究以2014年01月~2014年05月在郑州大学附属肿瘤医院收治的本地区汉族女性乳腺癌患者为病例组,共计254例,年龄18~79岁,中位年龄:46岁,诊断之前未接受化疗或放疗;以同期在本院收治的乳腺良性病变患者作为健康对照组,共计339例,年龄18~72岁,中位年龄:43岁。病例组有22例患者为导管原位癌或乳头派杰氏病,在232例浸润性导管癌患者中,有6例患者初次诊断时就确诊为远处转移,2例患者临床信息部分缺失,147例(63.4%)患者为绝经前状态。19例患者接受了新辅助化疗,177例患者接受了辅助化疗或解救化疗。所有入组人员均无其他恶性肿瘤病史、家族遗传病病史及其家族中无恶性肿瘤患者,并且均为没有血缘关系的本地区汉族女性。纳入分析的乳腺癌患者均有病理证实及发病年龄、月经状态、临床分期、分子分型、DFS等资料。
2.SNPs的选取、分型及质控:在本研究中,我们在HapMap数据库(http//www.hapmap.org)的北京汉族人群中筛选出等位基因频率>5%的SNPs。同时匹配在PubMed、Embase、中国知网、维普、万方数据库及中国生物医学文献数据库中以中文检索词“单核苷酸多态性”、“乳腺癌”、“激素受体状态”、“分子分型”、“预后”以及英文检索词“SNPs”、“breastcancer”、“ER”、“PR”、“subtypesofbreastcancer”、“prognosis”、“GWAS”为关键词检索中外文献报道的,已经在欧洲及亚洲人群中通过GWAS发现与乳腺癌的发病风险、临床病理特征、预后生存相关的SNPs位点。最终确定了rs10069690(TERT)、rs2046210(6q25.1 )、rs2981582(FGFR2)、rs889312(MAP3K1)、rs3803662(TOX3/TNRC9)五个位点[1,2,3,4,5]作为基因分型对象,采用天根基因公司全血基因组DNA抽提试剂盒抽提研究对象外周血的基因组DNA(deoxyribonucleic acid),测得DNA标本浓度及纯度。使用改进的多重高温连接酶检测反应(improved multiple high temperature ligase detection reaction,iMLDR )技术对rs10069690(TERT)、rs2046210(6q25.1)、rs2981582(FGFR2)、rs889312(MAP3K1)、rs3803662(TOX3/TNRC9)进行基因位点分型。基因位点分型是通过盲法的方式进行,基因位点分型的可重复性达100%。按照国际通用的免疫组化分型方法,雌激素受体(estrogen receptor,ER)、孕激素受体(progesterone receptor,PR)、人类表皮生长因子受体2(human epidermal growth factor receptor 2,HER2)、Ki67四个免疫组化指标将乳腺癌分为五种类型:LuminalA、LuminalB、LuminalHER2、HER2-enrich、三阴性乳腺癌(triple negative breast cancer,TNBC)。其中ER、PR阳性的判读标准为>1%,HER2基因过表达定义为免疫组化(immunohistochemical,IHC)检测HER2(3+)或荧光原位杂交(Fluorescence in situ hybridization,FISH)检测提示HER2基因扩增。LuminalA型定义为:ER、PR均为阳性,HER2阴性,且Ki67≤14%,PR>20%。LuminalB型定义为:ER或PR阳性,HER2阴性,且Ki67>14%。HER2-enrich型定义为:ER、PR均为阴性,且HER2阳性;LuminalHER2型定义为ER或PR阳性,且HER2阳性;TNBC定义为ER、PR均为阴性,且HER2阴性。
3.DFS定义为从疾病确诊至疾病复发或死亡的时间,包括区域复发(同侧胸壁或乳腺、双侧腋窝及双侧锁骨上下区、对侧乳腺)、第二原发恶性肿瘤、远处转移及任何疾病复发导致的死亡、随访终止时间。
4.月经状态的判断绝经后包含以下任何一种情况:1)既往接受过双侧卵巢切除术;2)年龄≥60岁;3)年龄<60岁并且在没有接受化疗、他莫西芬、托瑞米芬或卵巢功能抑制的情况下一年或者超过一年没有月经,并且促性腺激素释放激素(follicle-stimulating hormone,FSH)和雌二醇水平在绝经水平范围内;4)如果接受了他莫西芬或者托瑞米芬的治疗,同时年龄<60岁,FSH和血清雌二醇水平在绝经水平范围内。
5.随访时间本研究的随访时间从患者病理确诊时间开始,2017年12月31日为随访截止时间。随访方式为电话随访及门诊随访。随访内容包括患者生活状态、最近一次体格检查及辅助检查结果(彩超、钼靶、CT、全身骨显像或MRI)、当前治疗状态。
6.统计学分析:分别计算病例组与对照组SNPs位点的基因型分布频率,判断对照组是否符合Hardy-Weinberg平衡定律;应用SPSS20.0版统计建立数据库,运用卡方检验检测SNPs位点基因型在病例组及对照组分布是否有差异。运用非条件logistic回归分析计算比值比(odds ratio , OR )及95%置信区间(confidence interval,CI),评估不同SNPs位点的遗传模型与乳腺癌的发病风险。用均数±标准差表示计量资料的数据资料,频数及百分比表示计数资料的数据资料。方差分析用来比较计量资料之间的差异,判断SNPs位点的等位基因型在乳腺癌患者的发病年龄分布上是否有差异。计数资料的组间比较采用卡方检验,判断SNPs位点的等位基因型在肿瘤大小、淋巴结转移数目、激素受体状态、月经状态、免疫分型中是否存在差异;进一步采用单因素的logistic回归分析确定SNPs位点的基因型与临床病理特征的关系。定量资料与计数资料的相关分析应用Spearman分析。生存分析应用Kaplan-Meier分析及log-rank检验,判断发病年龄、肿瘤大小、淋巴结转移数目、免疫分型、月经状态以及SNPs位点的等位基因型是否与乳腺癌患者DFS有相关性。采用COX比例风险回归模型分析多个因素对乳腺癌患者DFS的影响。设定P<0.05为差异有统计学意义。
7.筛选出人群特异性位点后,选定相关基因,通过查阅乳腺癌相关文献资料,并对该基因进行分析和整合,进行GO功能注释以及KEGG分析,构建基因参与的乳腺癌相关基因的调控网络模型,并利用贝叶斯算法对网络模型进一步优化,最终找出基因调控乳腺癌细胞增殖的最大可能路径。
研究结果:
1.最终的分析包括254例乳腺癌病例和339名对照组成员。其中来自病例组及对照组各有一个样本无法进行rs10069690(TERT)基因型分型。Rs10069690(TERT)、rs2046210(6q25.1)、rs2981582(FGFR2)、rs889312(MAP3K1)的基因型在病例组与对照组中的分布没有统计学差异(P值分别为:0.772,0.308,0.376,0.468),而rs3803662(TOX3/TNRC9)的基因型在病例组与对照组中的分布具有显著性统计学差异(P=0.044)。在共显性遗传模型(OR=2.17,95%CI:1.18-4.00)及隐性遗传模型(OR=2.04,95%CI:1.14-3.66)中,与AA、GA相比,等位基因型GG显著增加了乳腺癌的患病风险(P值分别为:0.013,0.017)。
2.在临床病理特征与SNPs位点的相关性分析中,rs889312(MAP3K1)与肿瘤大小、激素受体状态的表达有显著相关性(P值分别为0.018,0.043),其中等位基因型AA与激素受体状态阳性有相关(P=0.014)。而rs10069690(TERT)、rs2046210(6q25.1)、rs2981582(FGFR2)、rs3803662(TOX3/TNRC9)与发病年龄、肿瘤大小、淋巴结转移数目、激素受体状态、月经状态、分子分型均无明显相关性(P值均>0.05)
3.在Kplan-Meier生存分析中,携带rs3803662(TOX3/TNRC9)不同基因型乳腺癌患者的DFS有显著性统计学差异(P=0.010),其中携带rs3803662等位基因型GG的乳腺癌患者有着更短的DFS。而携带rs10069690(TERT)、rs2046210(6q25.1)、rs2981582(FGFR2)、rs889312(MAP3K1)不同基因型乳腺癌患者的DFS无显著性统计学差异(P值分别为0.202,0.096,0.686,0.172)。
4.在COX比例风险回归模型分析中,矫正了年龄、肿瘤大小、淋巴结转移数目、分子分型等因素,结果显示与rs3803662(TOX3/TNRC9)的等位基因型GA/AA相比,GG型显著增加乳腺癌的复发或死亡风险[P=0.021,HR=3.065(95%CI:1.183-7.941)]。
5.GO分析结果提示rs3803662位点相关基因TOX3/TNRC9具有生物过程、分子功能和细胞组分三种功能,结合KEGG信号通路数据库得出乳腺癌相关基因调控网络图,经贝叶斯定理优化后筛选出TOX3/TNRC9参与的乳腺癌细胞调控网络的最优路径。
结论:
1.Rs3803662(TOX3/TNRC9)与本地区汉族女性乳腺癌的发病风险相关,且等位基因型GG增加了乳腺癌的患病风险。
2.Rs3803662(TOX3/TNRC9)是本地区汉族女性乳腺癌患者的独立预后因素,该位点是判断本地区汉族女性乳腺癌患者预后的重要位点。
3.初步建立TOX3/TNRC9基因参与的乳腺癌相关基因的初级调控网络模型,ER---TOX3/TNRC9是本网络肿瘤细胞增殖的最佳可能作用路径。