基于新一代测序技术及高分辨率质谱技术的人类蛋白质组学研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:Kaspersky_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
系统全面的注释人类基因以及其编码的蛋白产物是人类基因组学研究的核心内容。本研究综合基于实验验证和人工注释的人类标准蛋白质数据库Swiss-Prot, RefSeq以及基于信息学预测和电子注释的人类预测蛋白质数据库TrEMBL, Ace View构建了一个包含278,101个蛋白质及其可变剪接体的人类蛋白质参考数据集。并通过国际合作从EBI-PRIDE, NCBI-Peptidome和NIST三个国际蛋白质组学资源中心以及北京蛋白质组学研究中心国家重点实验室获取了近7万组来自于不同生物组织和生理条件的人类蛋白质组学质谱数据。在此基础上基于Galaxy平台整合翻译后修饰识别,综合质量控制等自主开发分析工具和已有蛋白质组学分析软件,构建了在线高性能并行化蛋白质组学分析平台Firmiana,服务于本次研究以及中国人类蛋白质计划和国家蛋白质科学基础设施—北京基地(简称“凤凰工程”)的大规模蛋白质组学数据分析工作。通过Firmiana平台基于收集到的1.8亿串联质谱谱图资源,累计鉴定了249,688个来至于156,970个人类蛋白质的非冗余肽段。通过比对分析这些肽段与新一代测序质控标准联盟(SEQC)产生的大量新一代测序得到的表达谱读段在染色体上的位置以及对应的编码基因信息,我们验证了三大人类基因组注释体系下的蛋白编码基因表达情况(RefSeq:89.3%, AceView:59.5%, ENCODE:86.6%)。在这些编码基因中包含了15,745个来自于AceView预测的未在其它人类基因注释体系中出现但在人类组织中广泛表达的新基因。我们综合cDNA, RNA-Seq, MS/MS三个水平的实验数据,对鉴定蛋白质的可信度进行了进一步的评估,并利用已有蛋白质组学研究信息基于序列同源性和功能域识别等策略,对鉴定到的蛋白质进行了进一步的结构和功能注释,此外,通过比对蛋白肽段和基因结构注释信息,本研究还发现了一定数量的非典型性转录事件,如罕见Kozak序列等。以上研究结果以及来源于cDNA, RNA-seq和MS/MS层面的注释信息及原始实验数据信息被进一步整合归档在SHuPP (SEQC人类蛋白质研究平台)中。SHuPP同时还基于本研究获取的17,633,234个高质量肽段谱图构建了人类高质量先验肽段数据集,并提供了在线搜索工具和离线数据包,这一系统全面的人类蛋白质注释资源将会有力的推动和加速人类基因组注释及蛋白质组学研究。
其他文献
近年来,微生物制剂作为一项生物强化技术,在水产养殖上获得了广泛地应用。由于存在着一些使用误区如忽略微生物制剂的作用机理,将微生物制剂等同于化学制剂,快速见效成为唯一
为实现市售橙汁饮品的有效鉴别,在分析与比较100%橙汁与橙汁饮料两类饮品荧光特性差异的基础上,采用主成分分析结合欧氏距离(PCA-ED)的方法对市售橙汁饮品进行定性鉴别,效果
目的 分析多模式社区日间康复对精神分裂症致残者精神症状的影响。方法 将2013年10月~2015年10月成都市武侯区玉林社区卫生服务中心在册的精神分裂症致残者36例纳入本次研究,
学生的学习过程一般由5个基本要素组成:
期刊
大青沟国家自然保护区是科尔沁沙地东南部生物多样性中心,也是十分宝贵的自然遗产,苔藓植物在该地区各种植被类型中广泛分布,对水土保持及维持生态系统稳定有重要作用。本次
目的:探讨磷脂酰肌醇激酶(PI3K)/哺乳动物雷帕霉素靶蛋白(mTOR)信号通路在利培酮联合拉莫三嗪治疗癫痫所致精神障碍患者中的表达变化及意义。方法:癫痫所致精神障碍患者80例
以雅江、康定地震诱发的崩塌、滑坡、泥石流、地裂缝等地质灾害的预防为例,提出对地震已发生的地质灾害再次复活时的预防办法,从而达到杜绝人员伤亡,减少财产损失的目的。
根据研究区域交通组织设计方案,建立VISSIM微观交通仿真模型。在现状交通调研数据的基础上,对模型中的驾驶行为参数,车辆行驶速度进行标定,并通过饱和车头时距和行程时间等指标,对
为了纪念X射线粉末衍射发现一百年,对其一百年来的发展与应用进行了概括和总结。主要包括以下3个方面的内容:决定X射线粉末衍射应用深度和广度的试验设备的发展,特别是高速度
本文利用超导经典电磁理论,导出了超导体在横向磁场中切割磁感应线时感应电动势的计算公式,结果表明,与计算通常导体感应电动势的公式相同.