【摘 要】
:
提出了一种新的蛋白质二级结构预测方法. 该方法从氨基酸序列中提取出和自然语言中的“词”类似的与物种相关的蛋白质二级结构词条, 这些词条形成了蛋白质二级结构词典, 该词
【机 构】
:
哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001
论文部分内容阅读
提出了一种新的蛋白质二级结构预测方法. 该方法从氨基酸序列中提取出和自然语言中的“词”类似的与物种相关的蛋白质二级结构词条, 这些词条形成了蛋白质二级结构词典, 该词典描述了氨基酸序列和蛋白质二级结构之间的关系. 预测蛋白质二级结构的过程和自然语言中的分词和词性标注一体化的过程类似. 该方法把词条序列看成是马尔科夫链, 通过Viterbi算法搜索每个词条被标注为某种二级结构类型的最大概率, 其中使用词网格描述分词的结果, 使用最大熵马尔科夫模型计算词条的二级结构概率. 蛋白质二级结构预测的结果是最优的分词所对应的二级结构类型. 在4个物种的蛋白质序列上对这种方法进行测试, 并和PHD方法进行比较. 试验结果显示, 这种方法的Q3准确率比PHD方法高3.9%, SOV准确率比PHD方法高4.6%. 结合BLAST搜索的局部相似的序列可以进一步提高预测的准确率. 在50个CASP5目标蛋白质序列上进行测试的结果是: Q3准确率为78.9%, SOV准确率为77.1%. 基于这种方法建立了一个蛋白质二级结构预测的服务器, 可以通过http://www.insun.hit.edu.cn:81/demos/biology/index.html来访问.
其他文献
近些年来,随着我国网络信息化技术的飞速发展,计算机网络早已成为人们工作、生活必不可少的重要工具之一,也成为促进社会经济发展的重要保障。然而伴随着计算机网络的普及与广泛
移居澳大利亚后,我便希望找到一份稳定的工作,最好是办公室的工作,如果能在政府里“当差”就更理想了.于是,我参加了新南威尔士州政府的公务员考试并被录用,至今已经担任州政
简要介绍了兰州重离子加速器上的高电离态原子光谱实验测量和取得的部分实验结果.
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
近些年来,随着我国电网建设与发展步伐的不断加快,带电作业早已成为输配电线路检修的重要手段,尤其是伴随着特高压输电工程的不断建设,对供电可靠性要求的不断提高,带电作业更是迎
[说明]解答本试题不得使用计算器.一、填空题(前4小题每题7分,后4小题每题8分,共60分)rn1.函数y=arccos(√12+4x-x2-2/4)的定义域是______,值域是_____.
数据库作为计算机进行数据存储、操作的重要形式,其在计算机信息技术发展中始终占据着十分重要的地位。尤其是信息经济高速发展的今天,人们对信息的需求量越来越大,而数据库中所
锅炉风机是一种将原动机的机械能转换为输送气体、给予气体能量的机械,它是火电厂中必不可少的机械设备,主要有送风机、引风机、一次风机、密封风机等,消耗电能约占发电厂发电量
随着社会的日益发展,重视锅炉安装的安装工艺对我们实际生活有十分重要的意义。知果不采取合理的方法,严密的安装措施,就很容易为锅炉的正常运行留下潜在的运行风险。本文从锅炉