论文部分内容阅读
蛋白质二级结构检测是结构生物信息学领域中一个发展已久但仍富有挑战性的课题。蛋白质二级结构的成功检测不仅为今后对蛋白质三级结构的功能预测奠定了基础,而且在药物设计、蛋白质结构可视化等领域也具有突出意义。本文应用局部螺旋拟合的方法对蛋白质局部二级结构检测的相关问题进行了深入研究。 研究国内外蛋白质二级结构检测的常用方法,本文首先提出了一种基于对偶四元数配准的蛋白质局部螺旋结构参数拟合方法。该方法首先提取蛋白质结构数据中各残基的C、N原子坐标,然后用滑动窗口分别构造各段的待配准数据和参考数据。接着以配准前后数据点的距离平方和最小为寻优目标,利用对偶四元数配准算法求解出最优的旋转矩阵和平移向量并计算出该段二级结构的螺旋参数:每周残基数(τ)、螺旋半径(ρ)和螺距(p)。将该拟合方法应用于仿真数据和实例蛋白质数据实验,结果表明:与传统螺旋拟合方法相比,本文拟合方法具有计算简便,抗干扰性好,拟合精度高的优点。 本文提出了一种基于蛋白质局部螺旋拟合的二级结构检测方法。该方法应用分类器并结合多种特征属性对蛋白质的α螺旋和β折叠这两种主要二级结构进行检测。通过对BP神经网络、支持向量机和随机森林三种分类器的分类性能进行验证,本文最终以螺旋参数τ、ρ、p为特征属性,选取对噪声容忍性较好的随机森林分类器对蛋白质的二级结构进行检测。 最后,在不同的蛋白质数据集上对本文方法的可行性及有效性进行验证。实验结果表明:对蛋白质α螺旋结构的检测精度达到了92.7%,对β折叠结构的检测精度达到了87.6%,和目前主流的DSSP、STRIDE方法的检测能力相当,而明显优于其它几种传统方法。