论文部分内容阅读
蛋白质结构分析是蛋白质科学领域中非常重要的研究内容,许多疾病都是由于蛋白质结构遭到破坏而引起的,因此蛋白质结构分析研究能够对医学、药学等领域产生重大影响。蛋白质折叠和蛋白质结构域预测是蛋白质结构分析中非常重要的两个问题,蛋白质折叠研究的是蛋白质结构的动态变化过程,蛋白质结构域预测研究的是蛋白质相对静态的结构,它们的本质是统一的,都是探讨蛋白质的一级结构序列如何影响和决定蛋白质的高级结构。随着学科交叉的日益广泛,越来越多的计算机方法和技术被应用到了蛋白质结构分析研究领域中,例如信号处理,分布式计算,数据挖掘,机器学习等等,这些计算机方法和技术为蛋白质结构分析领域的研究带来了新的生机和活力。本文首先提出了一种新的基于小波分析的蛋白质折叠模拟轨迹分析方法,在该方法中我们采用了DB2小波对折叠模拟轨迹的数据进行了九次的分解和重构滤波处理,并使用该方法分析了Trp-cage蛋白质的折叠模拟轨迹,结果显示我们的方法能够有效地提取折叠中间态和折叠事件,克服自由能图谱分析法的一些不足之处。通过分析,我们总结整理了Trp-cage蛋白质的折叠过程,并且还发现了TRP6的偏向性问题。接着,我们又使用小波分析方法分析了原生型和变异型lysozyme蛋白质的去折叠模拟轨迹中local contact的变化情况,我们的分析显示单点突变后的蛋白质结构非常不稳定,并显示变异点TRP62的ARG-TRP-ARG三明治结构对于lysozyme蛋白质的结构稳定性有着重要影响。同时,本文还提出了一种基于BP神经网络的蛋白质结构域预测方法,用以预测双结构域蛋白质的结构域边界,该方法中的神经网络包含169个输入层节点,5个隐藏层节点和1个输出层节点,网络训练采用了Levenberg-Marquardt算法,共使用了九种不同的特征属性,我们也同时简单分析了这九种特征属性对于最终结果的贡献程度。在该方法基础上,本文又引入了一个新的特征属性PBWLI,同样提出了一种基于BP神经网络的多结构域蛋白质预测方法,该方法的神经网络包含99个输入层节点,9个隐藏层节点和1个输出层节点,预测结果显示我们的方法能够在一定程度上有效地预测多结构域蛋白质的结构域边界。