论文部分内容阅读
【摘要】 根据世界卫生组织的资料显示,每年在世界上有超过80万的病人因为胃癌这个疾病死亡,而良好的诊断对于疾病的治疗是有助益的,但是目前并无有效能被广泛使用于诊断胃癌的生物指标。而在先前已发表的文献中指出,血清淀粉A对于许多疾病而言,是个具有潜力的疾病指标,而这个蛋白质本身具有相当多的变异形,包含了结构上、对偶基因、及胺基酸缺少所造成的各种变异形蛋白质,而这些变异形也被发现和许多疾病有相关,例如心血管疾病、前列腺癌、胃癌等。
【关键词】 蛋白质同素异构物组成胃癌诊断
【中图分类号】R604【文献标识码】A【文章编号】1671-8801(2014)07-0367-011材料样本
研究的样本为血液样本133个,其中有40位胃癌病人、41位胃炎病人、52位正常人,所有的血液样本经实验室进行质谱分析。我们可以看到,在TNM期数下,早期(StageI、II)和晚期(StageIII、IV)的数量比大概在1:1左右,TNM期数是由国际抗癌协会(InternationalUnionagainstCancer)首先提出的,一直被美国外科医师学院(AmericanCollegeofSurgeons)在1959年所组成的癌症分期和最后结果报告联合委员会(JointmCommitteeonCancerStagingandEndResultsReporting)所採用。它是根据肿瘤(T,tumor)、局部淋巴结(N,regionllymphnodes)和远处转移(M,distantmetastasis)的临床观察所定出来的分类系统;另外在样本的性别(女/男)大约是1.2:1的比例。
2方法与结果
我们建立了三种模式「SAAexpressionmode」、「Isoformmode」、「Hybridmode」来分析
(1)「SAAexpressionmode」
「SAAexpressionmode」的分析是想检视利用SAA单一蛋白质表现总量的方式来对于胃癌病人的诊断效能,在胃癌、胃炎、正常人三个族群样本的SAA表现总量及利用总量判别胃癌结果在这个研究中,我们将SAA的24个isoform相对于内标物的相对表现量加总起来间接代表SAA这个蛋白质的总表现量(以下简称SAA总量),从SAA总量来看,胃炎族群跟正常人族群是比较相似的,其表现量范围大多在一个定值以内,而胃癌病人族群的表现量范围则是比较广泛,因此如果我们想利用总量某个定值来做为区分胃癌病人的标准,很容易会造成两种情况:
1.定值取得较低时(SAA=2),部分的非胃癌病人样本会被误判为胃癌。
2.定值取得较高时(SAA=6),部分的胃癌病人样本会被误判为非胃癌样本。
因此我们以training的资料来寻找其门槛值(Threshold_value),希望门槛值可以达到在总量方面区分胃癌与非胃癌的效果。
结果,即使是使用具有最好「AUC」之门槛值来判断胃癌样本,在「SAAexpressionmode」中的结果在诊断上还是不足够的,因此我们可以推论光是以SAA总量要来当作判断胃癌病人的biomarker是不足够的。
(2)「Isoformmode」
「Isoformmode」主要则是想要探讨利用SAAisoformprofile对于胃癌病人的诊断效能,如图1;
图1:Isoformmode是为了要验证「SAAisoformprofile」是否具有成为胃癌诊断biomarker之潜力,当24种isoform表现量组成的profile经过「featureranking」、「Weightedsum」、「cross-validation&modelselection」后,将整合的结果输入至分类器对independenttest中胃癌样本诊断,藉以得知对于胃癌病人的分类效能。
由于我们认为在这些isoform中,可能存在著所谓「对于胃癌诊断具有干扰性」的isoform存在,若真的有干扰性的isoform存在,我们希望可以透过排序的方式可以将这些具有干扰性的isoform给排除,藉以提升对胃癌病人的判断正确率。
依照featureselection后整合排序结果使用SVM在不同数量的isoform下之cross-validation结果。
依照isoform的排序结果,我们测试SVM在不同数量的isoform下是否适合为这次研究之分类器,利用训练组各自进行3-foldcross-validation,将结果以ROCcurve表现,并计算其「AUC」(areaundercurve)。从「AUC」的结果来看,在三组dataset中的「AUC」都有达到0.8以上,而目前常用来诊断癌症的血液指标CEA其「AUC」只有0.7,这显示著SVM分类器搭配「SAAisoformprofile」在胃癌诊断方面的使用是具有潜力的。
(3)「Hybridmode」
「Hybridmode」是将「SAAexpressionmode」、「Isoformmode」来做一个合併的分析方式,在经过前面两种模式的结果我们发现SAAisoformprofile对于胃癌病人的诊断效能的确比起SAA单一蛋白质表现总量来得好,为了更加确认这一点,我们使用了「Hybridmode」,看看是否可以利用「Isoformmode」来弥补「SAAexpressionmode」的不足。经由「Hybridmodel」的结果,我们也验证了「SAAisoformprofile」的确是具有能力可以被使用来区分胃癌样本。而在dataset3并没有因为「Hybridmode」而有结果的改善,我们相信可能是因为在「Hybridmode」中第一层在利用「Threshold_value」判断样本时,已经将样本区分为非常相异的两群,而在这种情形之下,第二层「isoformprofile」能帮助改善效果便无法表现出来。
(d)以「SAAisoformprofile」使用在胃癌诊断时,SAAisoform数量的选用从表8我们可以知道,使用SAA在不同的方式之下对于胃癌病人判断的结果,从三种模组「SAAexpressionmode」、「Isoformmode」、「Hybridmode」的结果来比较,其中以「Isoformmode」的表现是比其他两种来得好的,而「Hybridmode」也因为含有部分的「Isoformmode」的修正,也比单纯只用SAA表现量的「SAAexpressionmode」要好,因此「SAAisoformprofile」做为胃癌诊断的biomarker是非常有潜力的。
3结论
由这个研究的结果来看,SAAisoformprofile的确具有诊断胃癌样本的能力,而且SAAisoformprofile比起目前常用的CEA,不管是在正确率、敏感度、专一性方面,都来得优秀,虽然就我们目前的结果来看,SAAisoformprofile在临床诊断的应用性应该非常的具有潜力。
参考文献
[1] 谯敏,向廷秀,姜政,高青,王丕龙.靶向COX-2的RNA干扰抑制胃癌细胞增殖及相关信号分子改变[J]. 肿瘤. 2006(12)
[2] Qiaojia Huang,Qingling Huang,Wannan Chen,Lin Wang,Wansong Lin,Jianyin Lin,Xu Lin.Identification of transgelin as a potential novel biomarker for gastric adenocarcinoma based on proteomics technology[J]. Journal of Cancer Research and Clinical Oncology . 2008 (11)
[3] Yongqing Li,Dan Yang,Yan Bai,Xiaoyang Mo,Wen Huang,Wuzhou Yuan,Zhaochu Yin,Yun Deng,Oleg Murashko,Yuequn Wang,Xiongwei Fan,Chuanbing Zhu,Karen Ocorr,Rolf Bodmer,Xiushan Wu.ZNF418, a novel human KRAB/C2H2 zinc finger protein, suppresses MAPK signaling pathway[J]. Molecular and Cellular Biochemistry . 2008 (1-2)
【关键词】 蛋白质同素异构物组成胃癌诊断
【中图分类号】R604【文献标识码】A【文章编号】1671-8801(2014)07-0367-011材料样本
研究的样本为血液样本133个,其中有40位胃癌病人、41位胃炎病人、52位正常人,所有的血液样本经实验室进行质谱分析。我们可以看到,在TNM期数下,早期(StageI、II)和晚期(StageIII、IV)的数量比大概在1:1左右,TNM期数是由国际抗癌协会(InternationalUnionagainstCancer)首先提出的,一直被美国外科医师学院(AmericanCollegeofSurgeons)在1959年所组成的癌症分期和最后结果报告联合委员会(JointmCommitteeonCancerStagingandEndResultsReporting)所採用。它是根据肿瘤(T,tumor)、局部淋巴结(N,regionllymphnodes)和远处转移(M,distantmetastasis)的临床观察所定出来的分类系统;另外在样本的性别(女/男)大约是1.2:1的比例。
2方法与结果
我们建立了三种模式「SAAexpressionmode」、「Isoformmode」、「Hybridmode」来分析
(1)「SAAexpressionmode」
「SAAexpressionmode」的分析是想检视利用SAA单一蛋白质表现总量的方式来对于胃癌病人的诊断效能,在胃癌、胃炎、正常人三个族群样本的SAA表现总量及利用总量判别胃癌结果在这个研究中,我们将SAA的24个isoform相对于内标物的相对表现量加总起来间接代表SAA这个蛋白质的总表现量(以下简称SAA总量),从SAA总量来看,胃炎族群跟正常人族群是比较相似的,其表现量范围大多在一个定值以内,而胃癌病人族群的表现量范围则是比较广泛,因此如果我们想利用总量某个定值来做为区分胃癌病人的标准,很容易会造成两种情况:
1.定值取得较低时(SAA=2),部分的非胃癌病人样本会被误判为胃癌。
2.定值取得较高时(SAA=6),部分的胃癌病人样本会被误判为非胃癌样本。
因此我们以training的资料来寻找其门槛值(Threshold_value),希望门槛值可以达到在总量方面区分胃癌与非胃癌的效果。
结果,即使是使用具有最好「AUC」之门槛值来判断胃癌样本,在「SAAexpressionmode」中的结果在诊断上还是不足够的,因此我们可以推论光是以SAA总量要来当作判断胃癌病人的biomarker是不足够的。
(2)「Isoformmode」
「Isoformmode」主要则是想要探讨利用SAAisoformprofile对于胃癌病人的诊断效能,如图1;
图1:Isoformmode是为了要验证「SAAisoformprofile」是否具有成为胃癌诊断biomarker之潜力,当24种isoform表现量组成的profile经过「featureranking」、「Weightedsum」、「cross-validation&modelselection」后,将整合的结果输入至分类器对independenttest中胃癌样本诊断,藉以得知对于胃癌病人的分类效能。
由于我们认为在这些isoform中,可能存在著所谓「对于胃癌诊断具有干扰性」的isoform存在,若真的有干扰性的isoform存在,我们希望可以透过排序的方式可以将这些具有干扰性的isoform给排除,藉以提升对胃癌病人的判断正确率。
依照featureselection后整合排序结果使用SVM在不同数量的isoform下之cross-validation结果。
依照isoform的排序结果,我们测试SVM在不同数量的isoform下是否适合为这次研究之分类器,利用训练组各自进行3-foldcross-validation,将结果以ROCcurve表现,并计算其「AUC」(areaundercurve)。从「AUC」的结果来看,在三组dataset中的「AUC」都有达到0.8以上,而目前常用来诊断癌症的血液指标CEA其「AUC」只有0.7,这显示著SVM分类器搭配「SAAisoformprofile」在胃癌诊断方面的使用是具有潜力的。
(3)「Hybridmode」
「Hybridmode」是将「SAAexpressionmode」、「Isoformmode」来做一个合併的分析方式,在经过前面两种模式的结果我们发现SAAisoformprofile对于胃癌病人的诊断效能的确比起SAA单一蛋白质表现总量来得好,为了更加确认这一点,我们使用了「Hybridmode」,看看是否可以利用「Isoformmode」来弥补「SAAexpressionmode」的不足。经由「Hybridmodel」的结果,我们也验证了「SAAisoformprofile」的确是具有能力可以被使用来区分胃癌样本。而在dataset3并没有因为「Hybridmode」而有结果的改善,我们相信可能是因为在「Hybridmode」中第一层在利用「Threshold_value」判断样本时,已经将样本区分为非常相异的两群,而在这种情形之下,第二层「isoformprofile」能帮助改善效果便无法表现出来。
(d)以「SAAisoformprofile」使用在胃癌诊断时,SAAisoform数量的选用从表8我们可以知道,使用SAA在不同的方式之下对于胃癌病人判断的结果,从三种模组「SAAexpressionmode」、「Isoformmode」、「Hybridmode」的结果来比较,其中以「Isoformmode」的表现是比其他两种来得好的,而「Hybridmode」也因为含有部分的「Isoformmode」的修正,也比单纯只用SAA表现量的「SAAexpressionmode」要好,因此「SAAisoformprofile」做为胃癌诊断的biomarker是非常有潜力的。
3结论
由这个研究的结果来看,SAAisoformprofile的确具有诊断胃癌样本的能力,而且SAAisoformprofile比起目前常用的CEA,不管是在正确率、敏感度、专一性方面,都来得优秀,虽然就我们目前的结果来看,SAAisoformprofile在临床诊断的应用性应该非常的具有潜力。
参考文献
[1] 谯敏,向廷秀,姜政,高青,王丕龙.靶向COX-2的RNA干扰抑制胃癌细胞增殖及相关信号分子改变[J]. 肿瘤. 2006(12)
[2] Qiaojia Huang,Qingling Huang,Wannan Chen,Lin Wang,Wansong Lin,Jianyin Lin,Xu Lin.Identification of transgelin as a potential novel biomarker for gastric adenocarcinoma based on proteomics technology[J]. Journal of Cancer Research and Clinical Oncology . 2008 (11)
[3] Yongqing Li,Dan Yang,Yan Bai,Xiaoyang Mo,Wen Huang,Wuzhou Yuan,Zhaochu Yin,Yun Deng,Oleg Murashko,Yuequn Wang,Xiongwei Fan,Chuanbing Zhu,Karen Ocorr,Rolf Bodmer,Xiushan Wu.ZNF418, a novel human KRAB/C2H2 zinc finger protein, suppresses MAPK signaling pathway[J]. Molecular and Cellular Biochemistry . 2008 (1-2)