论文部分内容阅读
蛋白质是一类常见的生物大分子,在生命活动中起了重要的作用。从全局的角度去研究蛋白质结构、演化或蛋白质中的关键残基等问题是十分必要的。将蛋白质分子转化成以氨基酸为结点,它们之间的相互作用为边的氨基酸相互作用网络,利用复杂网络理论来分析,为蛋白质相关问题的研究提供了新的视角。在本论文中,基于我们以前发表的环境依赖接触能(Environment-dependentResidue Contact Energy,简写为ERCE)计算工具我们构建了两类氨基酸相互作用网络:氨基酸接触能网络(AminoAcid Contact Energy Network,简写为AACEN)和点加权氨基酸接触能网络(Node-weighted Amino Acid Contact Energy Network,简写为NWAACEN)。在AACEN中,以氨基酸作为结点,它们之间的ERCE作为边。我们分析了AACEN的网络性质,包括它的平均度与网络规模的关系、度分布、小世界网络性质、主链上的相互作用对网络聚类系数的影响、长程边对网络性质的影响。我们最后探讨了AACEN与蛋白质结构、演化的关系,研究表明AACEN的聚类系数与蛋白质二级结构的含量以及序列的演化率呈负相关,而AACCEN的长程边比例则与蛋白质二级结构的含量及序列的演化率呈正相关。在AACEN的构建基础上,我们还引入了点权的概念,构建了点加权氨基酸接触能网络。在这个新类型的网络里,我们将氨基酸自身的物理化学性质考虑了到网络构建中来,即以氨基酸的物理化学性质为点的权重。据我们所知,这是第一次将点加权网络的概念引入到氨基酸网络研究领域。这里我们分别以氨基酸的溶剂可及表面积(SAS)、质量(M)、疏水性(Hy)和极性(P)作为网络结点的权重构建了NWAACEN,并定义了研究点加权网络的四个参数:加权度(Kw)、加权邻居度(Hw)、加权介数(Bw)以及加权最短路径(Dw)。然后利用NWAACEN分析了蛋白质相互作用界面热点的性质,发现蛋白质热点残基比非热点残基具有显著高的加权度和显著小的加权最短路径。最后我们基于这些点加权网络参数和氨基酸自身性质的不同组合,利用支持向量机构建了模型来识别蛋白质中的热点残基。结果表明基于8个参数的模型效果最好,这8个参数分别为M,Hy,P,SAS_Hw,M_Kw,Hy_Hw,P_Kw和P_Hw,预测结果的准确率、敏感性及特异性分别为72.22%、71.89%和72.41%。基于以上,我们开发了氨基酸相互作用网络的构建工具:AANW(Amino AcidNetwork Worker)来实现前面提出来的AACEN和NWAACEN以及其它常见类型的氨基酸网络的构建,并提供常见的网络参数计算和网络的可视化。