论文部分内容阅读
人类白细胞抗原(Human Leukocyte Antigen,HLA)是人类的主要组织相容性复合体(Major Histocompatibility Complex,MHC),其在控制免疫应答、参与疫苗接种、器官移植和自身免疫等方面起着基础性的作用。当人类体细胞受到病原体入侵,发生癌变或者吞噬细胞在吞噬侵入体内的异物之后,细胞内的HLA分子首先会与包含了病原体信息的多肽结合,形成MHC-抗原多肽复合物,进而将抗原多肽呈递至细胞表面,以供T细胞表面的特异性受体TCR(T Cell Receptor)识别。T细胞表位(T cell epitope)是抗原分子中决定抗原特异性的化学基团,它能够与TCR结合而引发一系列生化反应,最终刺激机体产生免疫反应。TCR对于MHC-抗原多肽复合物的识别,是细胞介导的免疫反应中起决定性作用的一环。因此,本文主要针对TCR、多肽、MHC三者间结合的问题进行研究,通过构建计算模型来预测MHC与抗原多肽的结合及TCR与MHC-抗原多肽复合物的结合。
本文第一部分提出了一个新的基于MHCII超类型预测MHCII与抗原多肽结合的预测模型,简称superMHC。首先在充分研究MHCII类分子与抗原多肽结合性质的基础上,我们提出了一个新的,基于大规模的MHCII抗原的定量亲和力值(pIC50)的MHCII类分子差异性度量指标——RDI(Repertoire Dissimilarity Index)。新的RDI能够有效量化MHCII类分子与多肽结合的特异性。其次将RDI与层次聚类算法结合,我们从41个MHCII类分子中成功识别出4个主要超类型(major supertype)及10个分离超类型(split supertype),并对这10个分离超类型能够识别的抗原多肽序列上的共同基序以及多肽结合特异性进行了分析。最后,我们提出superMHC,该算法利用超类型聚类结果来获取数据的更多关于MHCII和抗原多肽之间的结合信息,并通过定义氨基酸序列的核函数然,与集成学习方法结合,提高了MHCII类分子与抗原多肽结合的预测精度。
目前已经有大量算法被提出,并用于预测MHC与抗原多肽之间的结合,但用于预测TCR与MHC-抗原多肽复合物结合的算法还非常少且准确率都比较低。因此本文第二部分提出了一个新的预测TCR与MHC-抗原多肽复合物结合的计算模型,称为kernelTCR。KernelTCR方法是一个基于氨基酸序列核函数的RLS回归算法。首先我们应用一个核函数来定义不同CDR3b之前的相似度;然后,将核矩阵与RLS回归算法结合用以预测CDR3b与HLAI多肽的相互作用关系。kernelTCR方法的网络服务器可通过以下站点免费使用http://116.62.177.234:8080/services/kernelTCR(目前仍处于调试阶段)。
本文第一部分提出了一个新的基于MHCII超类型预测MHCII与抗原多肽结合的预测模型,简称superMHC。首先在充分研究MHCII类分子与抗原多肽结合性质的基础上,我们提出了一个新的,基于大规模的MHCII抗原的定量亲和力值(pIC50)的MHCII类分子差异性度量指标——RDI(Repertoire Dissimilarity Index)。新的RDI能够有效量化MHCII类分子与多肽结合的特异性。其次将RDI与层次聚类算法结合,我们从41个MHCII类分子中成功识别出4个主要超类型(major supertype)及10个分离超类型(split supertype),并对这10个分离超类型能够识别的抗原多肽序列上的共同基序以及多肽结合特异性进行了分析。最后,我们提出superMHC,该算法利用超类型聚类结果来获取数据的更多关于MHCII和抗原多肽之间的结合信息,并通过定义氨基酸序列的核函数然,与集成学习方法结合,提高了MHCII类分子与抗原多肽结合的预测精度。
目前已经有大量算法被提出,并用于预测MHC与抗原多肽之间的结合,但用于预测TCR与MHC-抗原多肽复合物结合的算法还非常少且准确率都比较低。因此本文第二部分提出了一个新的预测TCR与MHC-抗原多肽复合物结合的计算模型,称为kernelTCR。KernelTCR方法是一个基于氨基酸序列核函数的RLS回归算法。首先我们应用一个核函数来定义不同CDR3b之前的相似度;然后,将核矩阵与RLS回归算法结合用以预测CDR3b与HLAI多肽的相互作用关系。kernelTCR方法的网络服务器可通过以下站点免费使用http://116.62.177.234:8080/services/kernelTCR(目前仍处于调试阶段)。