论文部分内容阅读
随着人类基因组计划的完成和测序技术的发展,大量蛋白质序列数据不断涌现,深入研究这些数据获取蛋白质的功能信息是生物学研究的重要目的之一。本文基于蛋白质氨基酸序列,结合不同特征提取算法,采用支持向量机等多种分类器对蛋白质功能进行预测研究,主要工作内容概括如下:
(1)结合离散小波变换和支持向量机,提出了蛋白质亚细胞定位预测的新方法。结果表明,离散小波支持向量机模型不仅能显著地提高蛋白质亚细胞定位预测的准确率,而且能有效地克服低序列一致性数据集预测准确率较低的问题。
(2)结合蛋白质二级结构、氨基酸物理化学性质和残基的次序信息,构建了蛋白质酪氨酸硫酸化修饰位点预测的新模型—PreSulSite模型。结果显示酪氨酸位点邻近序列的卷曲结构、酸性氨基酸和残基之间相互作用对酪氨酸硫酸化的发生起到重要作用。此外我们建立了酪氨酸硫酸化位点的在线预测平台。
(3)基于信息熵,提出了Tau蛋白丝氨酸磷酸化修饰位点预测的新方法。我们分别探讨单个特征对Tau蛋白丝氨酸磷酸化修饰位点预测的影响,结果表明氨基酸物理化学性质、二级结构和无序信息有助于识别丝氨酸磷酸化位点。通过10倍交叉验证结果表明,本文构建的模型能有效地预测Tau蛋白丝氨酸磷酸化位点。