基于对偶四元数特征融合的蛋白质二级结构检测方法

来源 :燕山大学 | 被引量 : 0次 | 上传用户:ufs2269acjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质的二级结构检测是生物信息学领域的一个重要课题。深入地了解和认识蛋白质的二级结构,对于蛋白质折叠、蛋白质的建模、生物大分子药物设计以及蛋白质结构与功能分析等研究具有重要意义。在传统的检测方法中,经常通过氢键或者局部几何中的Cα原子来指定二级结构,信息太过单一,尤其对于β折叠的检测精度往往偏低。蛋白质二级结构中的β折叠与α螺旋结构不同,检测时不仅要考虑蛋白质序列上残基之间的结构关系,还要考虑空间中相邻肽链之间的结构关系。为了提高蛋白质β折叠结构的检测精度,本文提出一种基于对偶四元数的蛋白质序列和空间邻域特征提取方法。该方法首先求取蛋白质结构数据中C、Cα、N各类原子的坐标信息,利用弗莱纳公式理论构建以Cα为中心的原子坐标系,由坐标系序列可以求得对称正定矩阵,将对称正定矩阵转换为对偶四元数序列。然后计算出蛋白质序列邻域对偶四元数距离(序列DQ)和空间邻域对偶四元数距离(空间DQ),最后融合蛋白质几何结构信息(TCO、Kappa、Alpha、PHI和PSI)作为一类新的融合特征。本文使用机器学习中的支持向量机、随机森林和BP神经网络三种分类模型。通过对这三种分类器进行比较可知:在使用融合特征后,随机森林的检测精度可以达到96.48%,检测精度较高,且复杂度低。为了验证分类器的性能,求出混淆矩阵和ROC曲线等一系列性能指标,结果表明:可以使用随机森林对蛋白质的二级结构进行检测,且性能较好。最后,利用蛋白质标准数据集对本文方法的有效性进行验证。实验结果表明:本文方法对蛋白质α螺旋结构的检测精度达到94.2%,对β折叠结构的检测精度达到93.6%。其中β折叠的检测精度提高3.6%,明显优于其它传统的二级结构检测方法。
其他文献
本文以化工生产企业为例,介绍了电算化条件下原材料账务体系的设置原则与方法,探讨了原材料账务体系的运用,提出了在设置和运用过程中应着重抓好的问题,评价了原材料账务体系运行
高职服装专业英语课程的设置,应当以"就业为导向",根据企业对掌握服装英语人才的实际能力需求,进一步明确其在服装专业课程中的定位和设计思路,并以项目为载体对课程内容进行重
目的:慢性肾病(Chronic kidney disease,CKD)可表现出肾功能逐步减退,如肾小球和肾小管的滤过率下降,是复杂且严重的疾病。牙周炎是由微生物、宿主和环境等多因素相互作用的结果,是危害人类口腔健康的常见疾病。慢性肾病和牙周炎之间却有着一些共同危险因素从而影响着疾病的发生发展,可能存在着一定的相关性。采用Meta分析的方法评价牙周基础治疗对慢性肾病伴牙周炎患者炎症因子的影响,包括C
该配套测试设备是为某大型新系统专门研制的测试设备,主要用来对该新研系统进行功能和性能的检查。它是集模拟数据发生,数据接收和分析以及状态监测等多功能于一体的综合性测
随着我国经济持续高速增长,安全生产任务日趋繁重,近年来群死群伤重特大事故虽然呈现逐年下降趋势,但在煤矿,石油化工等高危行业10人以上伤亡事故还偶有发生,安全生产监管面临着巨
目的探讨女大学生的心理压力及对就业的影响。方法采用自行设计的调查问卷、压力量表,随机抽取2010年浙江省高校在校的女大学生683人,调查其压力度、就业规划、就业目的等资料
改革开放四十多年来,伴随着经济的高速增长,煤炭、钢铁、石油等行业均不同程度出现了重复建设、产能过剩的过度投资现象,非效率投资无疑造成了整个社会原本稀缺、有限资源的
岩土工程技术是土木工程建设中的一种新型技术,对岩土工程勘察工作具有至关重要的作用与影响。因此,需对岩土勘察工作有一个正确的把握,实现对岩土工程的正确勘测和勘测现场
本文针对档案交接工作中存在的问题,阐述了基层单位档案交接工作的重要性,制订了档案交接工作的整改措施。对基层单位档案交接工作起到了良好的指导作用。
随着人们生活水平的提高和社会经济水平的不断发展,人民对于身体健康水平也提出了新的更高要求。对医疗设备全生命周期的网络化管理有十分重要的实现意义。文中从医疗设备网络