基于质谱鉴定多肽组和组织特异性表达谱的MHC-I型表位呈递预测

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:tengjun1008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于新抗原识别的肿瘤免疫疗法中,对抗原表位能否被人类白细胞抗原(human leukocyteantigen,HLA)的准确预测是关键的一步。利用质谱鉴定的HLA多肽相对于利用亲和力实验鉴定的与HLA结合的多肽,包含更多细胞呈递抗原的信息。另外,特定细胞系或组织通过RNA测序得到的基因表达谱能够显著提高抗原呈递预测。尽管近年来积累了大量高质量的质谱鉴定的HLA多肽数据,但是只有很少一部分具有对应的表达量,因此难以把基因表达量整合到抗原呈递预测中。
  本研究首先利用质谱数据建立了三个抗原表位模式序列识别模型,分别是位置得分特定异性矩阵(position score specific matrix, PSSM),位置加权的PSSM以及基于迁移学习的深度神经网络。经独立评估后我们选择了PSSM来识别抗原表位的模式序列,然后从公共数据库中收集了来源于不同组织的34个细胞系中具有配对RNA测序数据的HLA多肽组。基于这些质谱数据,我们为其中20个HLA-I等位基因建立了PSSM,然后建立逻辑斯蒂回归模型(logisticregression,LR)来学习PSSM分数,基因表达量以及多肽长度的关系,以此来预测多肽能否被细胞系呈递。通过比较不同HLA-I等位基因和细胞系中特征权重和偏差,我们发现在这三个变量中存在着相似的关系。为了确认这个发现,我们把来自不同HLA等位基因和细胞系的多肽的PSSM分数,基因表达量和多肽长度特征合并在一起训练了单一的LR模型,并且把它的表现与HLA和细胞系特异的LR模型比较。我们发现混合数据训练的LR模型表现和HLA与细胞特异的LR模型并没有显著差别,并且与PSSM模型相比性能有显著的提升。基于这个发现,我们利用从公共数据库收集到的180,000条HLA多肽数据进一步搭建了一个支持66个HLA分型的泛化的抗原呈递预测模型EPIP(Epitope Presentation Integrated Prediction)。
  经大量的独立验证集评估,EPIP的平均0.1%PPV(positive predictive value)为51.59%,相对于目前的主流方法有显著提高,其中包括MixMHCpred(v2.0),NetMHCpan4.0-EL,NetMHCpan4.0-BA和MHCflurry(v1.2.2),它们的平均0.1%PPV分别为36.98%,36.41%,24.67%和23.39%。此外,EPIP在表位呈递预测和筛选免疫原性肿瘤新抗原上与目前不公开的基于深度学习的模型EDGE也是可比的。但是,EPIP的灵活性使得它能够应用在不同的场合,尤其是当用户希望把新的HLA多肽数据整合到EPIP中以支持新的HLA分型预测。EPIP可以从https://github.com/BGI2016/EPIP从获取。
  总的来说,本研究开发了一个容易使用并且公开的抗原表位呈递预测工具,EPIP,这个工具整合了质谱鉴定多肽组和表达量的信息,其性能与其他现有的方法相比具有显著的提高。
其他文献
日本女作家山崎丰子在1957年因处女作《暖帘》一举成名,成为了文坛一颗闪闪发光的新星。在成为专业作家之前,山崎一直从事着记者的工作,也正是由于这段宝贵的工作经历,既为她日后的创作收集了大量的素材和资料,又培养了她敏锐的观察力和对社会的强烈责任感,这些都对日后的创作起到了十分关键的作用。作为女性作家的山崎丰子不单单围绕着女性本身进行叙述,而是将笔触伸向生活中的方方面面,因此也得名“平民作家”。从大阪
学位
哈维尔·塞尔卡斯是西班牙内战后“第三代”作家的代表之一,长篇小说《骗子》出版于2014年,延续其“非虚构”创作风格,讲述了西班牙著名骗子恩里克·马尔科的人生经历与心路历程。本文以《骗子》为研究对象,解读主人公马尔科这一被语言建构的伪英雄形象的形成机制;在分析其与堂吉诃德对话性互文的过程中,总结“说谎者”的行为特征与原因,并阐释西班牙后现代社会历史语境及人们的心理状态。  论文共分为绪论、四个独立章
本文的研究属于文艺学原理中的文艺发展论问题。  何谓主义?主义不是思想游戏,而是指带有价值论断的社会化思想言论。20世纪堪说是一个主义自觉的世纪,种种主义为文艺家提供了重要的思想资源。有别于近代思想话语纯理论、纯思辨、纯学科化的特点,主义是在与社会、民族、学科,尤其是在与文艺的互动中生成的,其核心问题在于诊治现代性的病症,具有极强的现实应用性。  秉承论从史出的研究原则,发现,如将世界文学史以20
学位
近年来,越来越多的学者对康德审丑问题进行研究,并产生了一系列的争议。在此背景下,本文聚焦于保尔·盖耶的《康德论审丑的纯粹性》(Kant on the Purity of Ugly)一文,探讨在康德美学体系中“审丑”的可能性及其历史影响。  盖耶用康德鉴赏判断理论解释审丑,从纯粹鉴赏判断的角度来取消了纯粹审丑判断的可能性,认为审丑体验是混杂着生理、实践或道德判断。其依据在于,对象的纯粹审美反应必须是
本文首先将对韩国留学生汉语程度副词“更”的习得的偏误分析以及汉语程度副词“更”与韩语程度副词“?”的对比等研究进行综述,并说明本文采用的理论基础和研究方法。  第二章罗列出韩国留学生习得程度副词“更”的偏误类型,并分析韩国留学生产生这几种常见偏误的原因。  随后,我们将在第二章基础上,上升到语法理论的高度,分别分析汉语程度副词“更”和韩语程度副词“()”的语义、句法功能、语用功能,并对两者在这几个
在审美文化视域中,形象是主体对客体认知方式的体现,是加入了主观与客观因素、情感与思维特征、个人与集体化运作的表现。形象因素成为研究审美文化越来越重要的因素之一,在审美文化语境中,“形象”是对现实世界的视觉性表达和再现,它的含义是拟用来建构一种虚幻的关系,从而造成现实的去现实化。形象的表达需要以媒介为载体,通过媒介的传播,形象会有更加立体和真实的诉求,广告的存在正是作为这样一种媒介将形象展示在世人眼
学位
范云(451-503),字彦龙,南阳顺阳人,范镇从弟,官至尚书右仆射。天监二年(503)卒,赠侍中、卫将军,谥曰“文”。齐初投竟陵王萧子良门下,与萧衍、沈约、王融、谢朓等友善,为“竟陵八友”之一。丘迟(464-508),字希范,吴兴乌城人,丘灵鞠之子,官至中书郎,卒於官。天监五年(506)为临川王宏记室,随军北伐,不费一兵一卒、仅靠一篇文采飞扬的《与陈伯之书》,劝得伯之投降於萧梁,此文遂成为南朝骈
学位
近二十年来,网络文学的风生水起日渐改变着传统文学以及文学批评的整体面貌与发展格局,与之相应,人们对于网络文学的认识开始从自发走向自觉,并进入理性的思考和学理的探究,特别是新近的数年,学术界对于网络文学及批评的持续关注使其研究逐渐进入到文学理论与文学批评的学术前沿,并取得了诸多具有学术价值与现实意义的研究成果。本学位论文以批评文体视角为切入点做关于网络文学批评文体的现象及价值研究,具体操作如下:首先
学位
本文试图创建一个批评框架,基于此“异史氏曰”在跨文化交际翻译译本中处理的必要性和可行性将得到有效的论证。 为了实现上述目的,讨论译者主体性的运用显得尤为重要。与此同时,必须意识到译者主体性的运用贯穿于跨文化交际翻译活动始终,且译者对译本的选择这一主体性行为应该成为跨文化交际翻译过程的起点。正因此,论文开篇引入阐释学理论对“异史氏曰”的源起加以讨论,为全文的论证奠定基础。 与此同时,作者发现译者主体
学位
大段骨缺损的修复是骨组织工程亟待解决的难题之一。传统的骨修复策略侧重新骨的形成,往往忽略了血管化的作用,新生骨组织需要周围的血管为其不断提供营养物质以满足细胞的存活和生长。因此,同时具有促进骨生成和血管形成能力的支架材料有望用于大段骨缺损的修复治疗。支架材料联合多种生长因子诱导骨生成和血管生成是骨组织工程常用的方法之一,但生长因子具有半衰短、容易失活等缺点,大大增加了使用成本。目前,许多小分子药物