论文部分内容阅读
代谢组学是继“基因组学”、“转录组学”、“蛋白质组学”之后新兴的又一门“组学”研究。其关注的是小分子的代谢物,通过核磁共振、色谱质谱等实现对样品的检测,又借助于数据分析技术实现对高通量数据的分析。而模式识别就是一种常用且重要的数据分析技术。代谢组学模式识别技术的发展,为生命科学,医药学以及临床诊断等的发展带来了契机。尤其基于核磁共振(NMR)的代谢组学技术,其在疾病诊断中的作用显得越来越为重要。
胃癌作为全球第二大癌症,一直威胁着人类生命健康。尽管近几十年来癌症诊断技术发展迅速,例如各种内镜检查(如色素内镜法、荧光光潜内镜法及超声内镜等)和影像学检查、细胞动力学分析以及分子生物学诊断(如肿瘤基因、单克隆抗体、端粒酶和幽门螺杆菌感染等方面)等,但是这些方法多数存在阳性率不高、技术性强、费用昂贵等诸多问题,临床应用无法普及。
同时,引起科学界极大关注的还有近年来发病率逐年上升的胆道恶性肿瘤。胆道肿瘤起病隐匿,其临床表现常被胆道结石等其他疾病的症状所掩盖;就诊时往往已属晚期,手术切除率低,术后生存期短,这些都极大地影响了治疗效果。因此,寻求一种快速简单的诊断手段迫在眉睫。虽然ERCP(经内镜逆行胰胆管造影)技术以及一些细胞学技术、影像学技术的发展在一定程度上为疾病诊断带来了帮助,但是由于它们高成本以及操作的复杂化使得研究者们迫切希望找到一种简单易普及的手段。
然而,代谢组学技术作为一种快速而强劲的分析手段,近年来在恶性肿瘤诊断中发展非常迅速,但是国内外很少有对该方法应用于胃癌与胆道恶性肿瘤诊断的报道。
本文基于血浆与胆汁的核磁共振代谢组学数据,构建了一套有监督与无监督相结合的模式识别研究方法,并将其应用于胃癌以及胆道恶性肿瘤的诊断。首先,分别对收集到的病人血样及胆汁进行NMR检测,获取高分辨率的1H-NMR指纹图谱。其次,根据谱图数据特点分别尝试使用三种预处理方法对其进行主成分分析,获得最佳预处理方法。再对该数据进行有监督模式识别预报,分别尝试了主成分回归(PCR)、偏最小二乘(PLS)以及核偏最小二乘(KPLS)三种方法,并且对预报结果做了Relative Operating Characteristic(ROC)工作曲线。本文研究结果表明:线归一(inf-norm)预处理方法比较适合基于NMR的代谢组学数据分析;同时,分别建立了适用于两种癌症诊断的良好识别模型,得到较高的auc评价值。
本文所建立的研究方法,能较好地应用于基于核磁的代谢组学数据分析;同时提出将该种方法应用到胃癌与胆道恶性肿瘤的诊断中,是一种很有发展潜力的癌症临床诊断辅助手段。