论文部分内容阅读
随着人类基因组计划的实现,生命科学研究进入后基因时代。后基因组时代生命科学的中心任务就是阐明基因组所表达的真正执行生命活动的全部蛋白质的表达规律和生物功能。因此,生命科学的研究重心从基因组学转移到蛋白质组学。在蛋白质组学研究中,蛋白质的氨基酸序列的鉴定是一项非常重要的研究。目前,国内外的各生物信息实验室和公司已经研究出许多基于串联质谱的蛋白质鉴定算法。但是,这些算法中只有少数几个算法能够鉴定存在突变或翻译后修饰的蛋白质,且各有局限性。蛋白质翻译后修饰在生命体中具有十分重要的作用,它使蛋白质的结构更为复杂,功能更为完善。大多数蛋白质中存在翻译后修饰,目前已知的氨基酸残基上的共价修饰就多达200多种。此外,由基因突变引起的蛋白质突变,对生命体也有着非常重要的影响。因此,对存在突变或翻译后修饰的蛋白质的鉴定是一项很有研究价值同时极具挑战性的生命科学研究。2000年,Pavel A.Pevzner等研究人员提出Spectral Alignment算法,该算法能够鉴定存在突变或翻译后修饰的蛋白质,而且不需要预先知道实验串联质谱中存在何种类型的突变或者翻译后修饰,但是这个算法也存在较多缺点,鉴定准确率不高。本文提出Modified Spectral Alignment算法,该算法对Spectral Alignment算法进行了改进,不仅改进原算法中D(k)和k-最佳Spectral Alignment的求解方式,引入相对熵原理提高打分函数的精度,结合“双端考虑”抑制假阳性,而且建立翻译后修饰频率矩阵,推测未知类型的翻译后修饰。与Spectral Alignment算法相比,Modified Spectral Alignment算法不仅提高鉴定准确率达30%,而且抗噪声能力也有比较明显的提高。