基于LPC及PSI-BLAST谱的蛋白质结构类预测方法研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:znchen1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是一门新兴的前沿交叉学科,它综合运用数学、计算机科学和生物学的各种工具。它的研究焦点主要集中于使用统计学和计算机科学工具,分析和解释海量分子生物学数据信息。生物信息学有十分广泛的研究领域,几乎涉及了生命科学的所有内容。基于单一的蛋白质序列信息来预测蛋白质的二级结构又是生物信息学中一个重要的根本性问题。  在第二章中,我们主要叙述了一些常用的确定蛋白质结构的方法。其中包含三种实验测定蛋白质三维结构法和计算法预测蛋白质结构法。在计算法预测蛋白质二级结构法的基本步骤中,介绍了一些简单的特征提取模型和常用的一些机器学习分类器:k-近邻算法,贝叶斯分类器和支持向量机。  在第三章中,我们将给出预测蛋白质的二级的一个新方法。我们应用了一个被称为线性预测编码的信号处理工具,并使用它从蛋白质序列提取序列特征和预测蛋白质二级结构类。首先,使用PSI-BLAST工具将原始的蛋白质序列中的进化信息转化为位置特异性得分矩阵。其次,线性预测编码算法将被应用于从蛋白质序列对应的位置特异性得分矩阵中提取氨基酸之间的位置相关性特征并且将最终的线性预测编码系数作为预测模型的特征向量。最后,基于支持向量机的交叉验证试验表明我们所提出的方法应用在四个标准数据集上取得较好的全局精确度。本文提供了一个新的特征提取方法并且在蛋白质二级分类问题上取得较好的表现。
其他文献
分数阶微分方程是从实际问题中抽象出来的一类微分方程,作为微分方程理论的一个重要组成部分,对它的研究一方面可以丰富微分方程的数学理论,另一方面也为研究化学,生物,物理,工程及
三角级数作为Fourier分析的核心内容,吸引了大量数学学者的研究.对Fourier分析中收敛性问题的研究起源于经典的Chaundy-Jollife定理.经过许多数学学者的共同努力,在非负性条件
最近,我们接触到这样一件案例:某事业单位的一名党员处级干部利用上班时间到一所学校讲课并领取讲课费,这种行为是否属于违反规定兼职取酬错误?笔者认为,对该党员处级干部到
在金融数学中,用随机控制理论研究最优投资问题是一个重要的研究领域。随着全球经济的发展,投资者及投资机构几乎每天都面临着投资决策问题,研究各类模型下的最优投资问题变得尤
[音乐手机] 随着数码音乐越来越普及,年轻的消费者几乎是人手一台MP3随身听,像iPod、iriver等MP3随身听也就因此成为近年来最红的IT商品。不过随着手机厂商纷纷将手机中加入M
1990年物理学家H.Hiro-oka,O.Matsui,T.Naito和S.Saito在文献中引入q-形变Virasoro代数Lq的定义.它是一个无限维李代数,一组基元为{Lαm|m∈Z,α∈Z+},它的李括号定义为[Lαm,Lβn]
以“能源效率,绿色未来”为主题的2011ABB低压酒店行业研讨会近日在杭州成功举行,近30位酒店业内设计师、业主、工程公司客户代表参加了此次会议.ABB低压新浪官方微博对此进行了
二阶延迟微分方程在脉冲及控制理论中有着广泛的应用,但对于二阶延迟微分方程的理论解和数值解的稳定性的研究并不多见。本文主要研究一类二阶多延迟微分方程的稳定性,首先,通过
Psi和Polygamma函数在特殊函数理论、不等式理论、统计学以及研究经典函数和常数等诸多领域有着广泛的应用,并且已有许多丰富的重要结果.基于前人的研究成果,本文主要研究与Psi和Polygamma函数相关的完全单调函数以及不等式,因此完善与推广一些相应的结论.利用Laplace变换的卷积定理,Bernstein’s定理和凸函数等理论,给出涉及Psi和Polygamma函数函数的均值不等式,研究
学位