论文部分内容阅读
高通量测序技术对于生物医学研究来说是一次飞跃性的提高,它对于传统医学与疾病的研究而言更是一次革命性的改变,特别是对个性化医疗的普及和发展起着非常关键的作用。本文主要基于两种类型的数据,介绍了高通量生物医学数据在疾病研究中的不同应用。基于16S rRNA数据的疾病预测平台构建:基于高通量测序的宏基因组学研究是近年来的研究热点之一。目前宏基因组学分析的工具很多,但数据分析仍是个难题,特别是对于缺乏生物信息学或计算机背景的用户来说。为了解决这个难题,本研究开发了一个用户使用友好的宏基因组分析平台---MetaDP(Disease Prediction for Metagenomic Datasets),该平台针对16S rRNA测序数据构建了一套自动分析流程,包含了质量过滤、操作性分类单元(Operational Taxonomic Unit,OTU)聚类、多样性分析以及疾病预测。在当前的工作中,我们将平台应用于108个儿童肠道微生物16S rRNA测序数据分析,并构建了一个基于支持向量机(Support Vector Machine,SVM)的肠道应激综合征(Intestinal Bowel Syndrome,IBS)预测模型。同样地,该平台还可以通过整合更多的预测模型而应用于与微生物相关的其他疾病分析中,如肥胖、代谢综合征或肠癌等,为疾病的预防与早期诊断治疗提供参考依据。基于蛋白组学数据的卵巢癌预后预测分析:卵巢癌是死亡率最高的女性生殖系统恶性肿瘤,大部分卵巢癌患者发现时已为晚期,5年生存率低。因此,寻找有效、准确的预后生物标志物对卵巢癌的治疗与预后具有重要的意义。对174个卵巢癌患者的蛋白质组学样本进行生物信息学分析,最终获得13个差异蛋白标志物。通过功能富集分析发现,这些蛋白标志物显著富集到多个细胞黏附过程中,且与肿瘤相关的PPAR通路显著关联。将这些蛋白标志物应用于多个卵巢癌数据集,进行预后评估验证,均表现出稳定、良好的预后预测效果。结果表明该研究发现了一组可靠的卵巢癌生物标志物,可以有效地预测预后效果,有利于改善病人的生存质量。