1.机器学习方法预测蛋白质结构域与配体的相互作用 2.利用色谱保留时间辅助多肽的质谱鉴定

来源 :中国协和医科大学 | 被引量 : 0次 | 上传用户:dailynice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
很大一部分的蛋白质相互作用是通过多肽结合型的结构域来介导的,这种结构域包括SH2,SH3,PDZ和MHC等等。然而用实验的方法筛选这些结构域结合的配体费时费力,而且,由于高丰度配体的抑制作用,实验方法很难筛选到低丰度的配体。一种理想的研究蛋白质相互作用的方法就是通过计算机高通量的筛选蛋白质序列数据库,然后再用实验的手段验证计算机预测出来的最可能的相互作用。目前的预测系统通常都在有限样本的交叉验证中表现良好,但这并不能保证他们在实际的数据库筛选中仍有好的表现。本文采用了三种新型的蛋白质序列编码方式,使用机器学习的方法建立了一个整合的预测系统,筛选了Swi ssprot和Genbank蛋白数据库来预测10个SH3和3个PDZ结构域的配体。预测结果中的部分配体蛋白已经被其他研究者的实验证实为阳性,这说明该系统具有良好的预测能力,它的预测结果对后续的验证实验具有一定的指导意义。在应用二级质谱图鉴定多肽时,为了降低鉴定的假阳性率,通常会提高检索软件的阈值设定,这种行为导致了多肽鉴定的假阴性率的提高,大大降低了蛋白质组研究的效率。本文构建了经验的多肽保留时间数据库(Empirical Peptide RetentionTime,EPRT),在二级质谱鉴定中引入了保留时间作为新的参数。在新的实验中,谱图质量低于一定标准的的多肽鉴定,其保留时间还要和它们在EPRT数据库中的经验保留时间相比较,来进一步决定它们是否为阳性鉴定。在18个标准蛋白混合物和尿蛋白质组的实验中,应用保留时间辅助,使鉴定的阳性谱图数增长了15%-60%,阳性多肽数增长了8%-18%。不考虑谱图的质量,仅使用保留时间新鉴定出的谱图的假阳性率为3.7%;如果加上最低的Xcorr阈值来控制谱图质量,则假阳性率降低为0.18%。这种方法可以鉴定出一些不合标准的低丰度多肽的谱图。另外,EPRT数据库也增加了多肽鉴定的可信度,这对那些仅由一张二级质谱图鉴定出的多肽来讲尤其重要。随着更多的多肽的经验保留时间被收集到EPRT数据库中,质谱鉴定的效率会进一步提高。该方法可应用在任何标准的、可重复的分离系统中。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
中医(中西医结合)临床实践指南的制定需要耗费大量的人力、物力和财力。指南制定者需要检索获取与评价已有证据,并评估是否需要和如何制作新的系统评价。文章介绍了从已有指南
<正>信号素(semaphorins,Sema)是一类在神经系统发育过程中发现的神经导向因子[1]。研究发现信号素家族至少含有20个成员,它们发挥着不同的生物学功能,如心脏发生、血管发生[
种猪挑选是项极其重要的工作,常通过肉眼观察来挑选种猪。这种挑选种猪的方法既快速又实用。由于这种方法操作简易,同时效果比较可靠,而被广大饲养者采用。笔者根据所学的知识及
期刊
[概述]藿香又名土藿香,为唇形科藿香属,多年生宿根草本植物藿香[Agastahe(rugosa(FischetMey)Kuntze],以全草入药,性能解暑化湿,行气和胃,可治中暑发热、头痛胸闷、恶心呕吐
类风湿性关节炎(rheumatoid arthritis, RA)是一种以慢性滑膜炎症、关节软骨侵蚀为特征的自身免疫性疾病,发病机制未明。Ⅱ型胶原蛋白(typeⅡcollagen, CⅡ)是软骨基质的主要
指南小组构建是指南计划阶段的重要工作内容,也是保障指南制定工作顺利开展的基础。本研究根据中医(中西医结合)临床实践指南制定的实际情况,结合对其他指南制定手册的系统评
本文通过对金昌市肉羊生产现状及实际需求的实地考察和对国家农业生产管理和质量追溯政策态度的基础上,基于物联网等高新信息技术,对肉产品生产、加工、流通和消费进行全过程
研究背景:目前糖尿病已成为仅次于心脑血管病症和癌症的第三大死亡疾病,它是一种影响体内胰岛素和糖含量的疾病,共有两种主要类型,分别为Ⅰ型和Ⅱ型,其共同特征是胰岛β细胞