论文部分内容阅读
迄今为止,已经鉴定出了450多种独特的蛋白质修饰,包括磷酸化、乙酰化、泛素化和小泛素化,它们是具有许多生物学功能的细胞蛋白质的调节机制,并且在许多原核和真核蛋白质的功能调节中发挥作用。在这些PTMs中,乙酰化是一种动态且高度保守的翻译后修饰,在调节多种细胞过程中起着关键的作用。由于乙酰化在某些相关的生物学过程中的重要作用,它成为最重要的可逆蛋白翻译后修饰之一。异常的乙酰化蛋白质与许多病理疾病有关,如癌症,神经性疾病和代谢性疾病,所以进一步了解乙酰化蛋白质对以后的分析乙酰化机理和相关的实验验证,药物开发提供指导性意义。蛋白质的功能常有标注KW,GO,Smart,Pfam,InterPro,PRINT,PROSITE,SUPFAM分析得出,乙酰化蛋白质在正负样本中差距较大,正样本的功能标注信息含有蛋白质的数量远远大于负样本,且KW,GO信息量远远大于其他Smart,Pfam,InterPro,PRINT,PROSITE,SUPFAM的信息量。人类蛋白质6832条蛋白质中,正样本有3404条,负样本有3428条,正负样本基本持平。关键词中乙酰化关键词在正样本中有3392条。在GO信息统计分析中发现乙酰化在细胞核和细胞质过程中起着关键作用,且在GO数据库三大类中,正样本细胞组分含有蛋白数量远远大于其余生物学过程和分子功能。Smart,Pfam,InterPro,PRINT,PROSITE,SUPFAM的信息量在整个正负样本中含有蛋白质条数非常少,对整个分析结果占有次要作用。乙酰化是翻译后修饰的一种,通常与乙酸发生反应,将乙酰基引入有机化合物中,为了深入了解乙酰化的机理,需要在生物系统中正确识别乙酰化蛋白质。尽管使用了质谱法进行的高通量实验研究已经确定了许多乙酰化位点,但大多数乙酰化位点仍然未被发现,为了降低实验成本,提高乙酰化位点的有效性和效率,介绍了基于信息技术的计算方法。本研究功能域注释(FDA)和亚细胞定位信息为基础,通过灰色系统模型和KNN评分,从序列保存信息中提取特征,建立了一种预测乙酰化蛋白新的计算方法。结合Relief特征选择算法的详细特征分析和应用,给出了三个数据集5次交叉验证的结果。所获得的精度均令人满意,作为平均性能,精度为77.10%,马修斯相关系数为0.5457%,AUC值为0.8389,这些工作对相关的实验验证有一定的指导作用,为研究乙酰化的机理提供了有益的见解,并对进一步研究其他PTM过程提供了有力的帮助。本文通过对人类乙酰化蛋白质功能标注信息的统计分析和融合乙酰化蛋白的特征,功能域注释鉴定乙酰化蛋白可以提高乙酰化实验的效率,对基础研究和药物开发的实验人员提供参考和帮助。