论文部分内容阅读
异三聚体G蛋白在信号转导过程中具有重要作用,对异三聚体G蛋白信号转导系统的研究有助于新药的研发,有助于揭示植物应对外界抗逆胁迫的机制。但是,用生物化学实验方法进行异三聚体G蛋白的相关研究成本高、时间长,于是产生了一些与异三聚体G蛋白研究相关的生物信息学工具。前人开发了多种工具预测异三聚体G蛋白的偶联受体(GPCR),但至今尚未见异三聚体G蛋白下游效应器蛋白预测工具的报道。 本文通过异三聚体G蛋白互作蛋白来筛选异三聚体G蛋白下游效应器蛋白。共收集了9个物种的116个下游效应器蛋白作为初始正样本,负样本在这9个物种的全部蛋白序列中随机产生(不包含下游效应器的序列)。使用CD-HIT把全同率降到40%以下,获得含有104个蛋白质的正样本,含有30622个蛋白质的负样本,组成10个正负样本1:1的训练集。接着本文对7种特征提取(包括AA、CKSAAP、PROSITE以及它们两两组合、三者组合组成的联合特征)和4种分类方法(包括朴素贝叶斯、K最近邻、随机森林、支持向量机)关于异三聚体G蛋白效应器的预测结果进行了评估。最后选择使用reliefF做特征选择后的CKSAAP_PROSITE_200特征提取方法和随机森林分类方法做预测工具G-Effector的构建。 预测工具G-Effector的ACC为74.62%,MCC为0.4925,预测性能好于基于同源比对的BLAST、PSIBLAST、HMMER。可作为异三聚体G蛋白下游效应器蛋白的有效预测工具。最后,本文使用G-Effector预测工具结合基因芯片数据对水稻异三聚体G蛋白下游效应器蛋白进行预测,从得分最高的20个预测结果中筛选出8个水稻异三聚体G蛋白的效应器,为开展生物化学实验研究指明了方向。本文还提供了G-Effector工具在线预测,可通过http://bioinformatics.fafu. edu.cn/geffector访问。