基于质谱筛选差异表达蛋白的统计学方法研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:lliiuuffuuyyaann
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
准确、高效地筛选差异表达的蛋白质是基于质谱的定量蛋白质组学的重要研究内容之一,是发现生物标志物的先决条件,对疾病的早期诊断具有促进作用。但是差异分析方法较难选择、蛋白质定量信息缺失较多、筛选结果质量参差不齐等挑战一直存在于定量差异分析工作中。本文在前人的研究基础上,针对这些问题做了以下三个方面的工作:(i)在含有内标的真实蛋白质组学数据D1和D2上,评估了包含Welth检验、置换检验、ROTs、SAM和EBRCT法在内的五种有代表性的差异筛选统计方法,同时合理控制了检验结果的质量,通过比较ROC曲线、pAUC、TPR、FPR和FDR,证实了在D1和D2中,针对定量差异分析问题,结合经典统计理论与贝叶斯理论的统计方法和从其他组学借鉴的方法是不错的选择。(ii)根据蛋白质组学定量信息缺失的特点,在D1的基础上,模拟了九个含有不同缺失比例的数据,分别进行含有57种不同插补次数的链式等式多重插补,通过比较插补前后的绝对Pearson相关系数、平均MAD和平均MSD,可知多重插补的效果与插补次数和缺失比例相关,当缺失比例不变时,插补次数越多,插补效果不一定越好,且最优插补次数随着缺失比例的不同而不同。(iii)探讨了包含均值插补、基于丰度分布的插补、k近邻插补和多重插补在内的四种有代表性的插补方法对除EBRCT法之外的其它四种统计方法在筛选差异表达蛋白质方面检验功效的影响,通过比较ROC曲线、pAUC.f-score和g-score,以提醒相关研究人员在差异分析前,应慎重处理缺失数据。
其他文献
目的:探讨2DUS(二维超声)联合CDFI(彩色多普勒超声)对乳腺结节患者良、恶性鉴别诊断效能的影响。方法:将2016年6月~2018年10月治疗乳腺结节的76例患者为研究对象,采用2DUS检
近年来,随着生产规模不断扩大、劳动力成本持续增加以及国家发展战略的调整,使得纺织行业需要不断提高自身的自动化与智能化水平,应时而生的工业机器人智能分拣喂纱系统能够有效地代替人工实现纱管缺陷检测、分拣喂纱的过程,关于该系统的重要性不言而喻。本课题依附于该系统而设计出智能分拣喂纱系统监控平台,主要完成工作有以下几点:(1)设计监控平台的整体方案。选取基于Linux操作系统和ARM作为视频采集端的软、硬
根据具体实际,对某县初级中学综合楼的建筑结构进行设计,结合学校建筑的要求,选择了合适的结构体系,并进行了相关的结构计算。为农村学校的建筑设计提供一定的参考。
黄酮是植物体内一类重要的代谢物,它们不仅对植物的生长、发育及适应性等方面有重要的调节作用,而且含有很多活性成分具有良好的药用价值。本文综述了黄酮类物质在植物和药理
粗腰突腹,不仅影响形体美,而且还易诱发多种疾病。下面介绍的一套塑腰练习方法,通过腹肌和背肌收缩,可以消耗腰腹部多余脂肪,达到增强肌肉弹性和力量,改变腰部形态的目的。
期刊
【正】环境噪声已成为公众越来越关注的问题.近10余年来,由于下述的三个原因之一公众对环境噪声的投诉明显地增多了,这种投诉的增多一定程度上并非由于环境噪声的升级,而是由
目的 研究川芎嗪(TMP)对庆大霉素(GM)致耳中毒豚鼠耳蜗组织听脑干反应(ABR)阈值和8-羟基脱氧鸟苷(8-OH-dG)的影响。方法 选用健康白色红目体质量200~250 g的豚鼠80只,随机分为:TMP组、
该文首先介绍了5G技术的特点及其对人们工作、生活直至社会的影响。其次,在厘清中国科技馆定位与职责的基础上,从提高科普资源研发质量和共建共享程度的角度,分析了中国科技
藏族拔河刘生文藏族拔河独树一帜,别有情趣。有“池和滩”、“浪青沙西合”和“格吞”等。“池合滩”汉意为牛,是两头奔跑的牛在较力。比赛是用单人“浪青沙西合”的拔河绳和场
无论东西方,男旦和阉人歌手都对我们的文化特别是近代文化有至关重要的影响。在科技高度发展的当今非常有必要开展对阉伶和男旦艺术的探讨与研究,以期对我们今天的声乐艺术发展