基于数据的蛋白质功能预测研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:smtsmarsh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生命活动的物质基础,对其功能的预测至关重要。目前主要有两种方法测定蛋白质功能:生物实验方法和基于数据的计算方法。生物实验法存在耗时长,成本高的问题,因此基于数据的方法是目前对蛋白质功能预测的研究热点。本课题使用基于数据的方法对蛋白质功能进行预测,研究内容主要包括以下三个方面:(1)构筑基于结构域和改进MIMLSVM的蛋白质功能预测模型。针对现有MIML算法预测精度不高的问题,设计一种基于改进MIMLSVM预测蛋白质功能模型。首先,采用改进的Hausdorff方法计算包之间的空间距离,并结合K-Medoids方法将MIML(多示例多标签)问题退化为多标签问题,以提高预测精度;然后,利用SVM算法将多标签问题转化为多个独立的二分类问题,结合蛋白质数据的特点,建立蛋白质功能预测模型,并利用粒子群算法优化模型参数;最后,通过对七种生物蛋白质功能预测的实验,证明所建模型的优越性。(2)设计基于AVC-SVM的芋螺毒素离子通道类型预测模型。针对现有方法对离子通道预测中存在的信息冗余问题,设计一种基于AVC(Analysis of Variance and Correlation)和SVM的芋螺毒素离子通道类型预测模型。首先用F值衡量特征对于结果的显著性影响水平,通过粗选的方式过滤F值较小的属性;然后引入Pearson Correlation Coefficient衡量属性间互相的冗余度,通过设置阈值过滤相关性较强的属性得到细选的结果;最后使用SVM预测芋螺毒素的离子通道类型。对比实验表明:AVC-SVM模型在交叉验证下得到总体预测精度91.98%和平均预测精度92.17%,使用氨基酸组合和二肽组合作为特征的个数为68,与其它模型相比,保证较高精度的情况下运行时间由8至11秒缩短为0.085s。(3)实现芋螺毒素离子通道类型的在线预测。为方便其他研究者进行芋螺毒素的相关研究,使用C#和matlab混合编程技术,在AVC-SVM模型的基础上开发芋螺毒素离子通道类型的在线预测系统。该系统输入是芋螺毒素蛋白质的氨基酸序列,输出是对应的离子通道类型。同时,该系统提供容错提示功能。当输入特殊字符、代表模糊不清的氨基酸残基的不合法字符、标点符号或者氨基酸序列长度小于3bp时,可以返回错误提示,方便用户及时改正输入。此外,该系统提供下载功能,供其他研究者下载相关论文和实验数据。
其他文献
当前隔振研究中,振动控制策略无论是在学术研究还是在实际应用中都得到了迅速的发展。半主动控制已成为近年来振动控制研究的热点之一,因为其控制效果接近主动控制策略,而且
多波段图像融合是一种重要的信息表征手段,在医疗、军事、安防等多个领域均有重要的应用。在多波段图像融合中,各波段图像均通过相应的传感器捕获信息并进行综合。在各波段图
参政议政是民主党派的一项基本职能和中心工作,是参政党参与国家各项建设的主要形式,是检验民主党派自身建设搞得好不好的重要标准。围绕经济社会中的重要问题以及人民群众普
双离合器自动变速器(Dual clutch transmission,DCT)的换挡研究包括挡位决策和换挡过程控制两部分内容。其中挡位是影响车辆经济性、动力性和驾乘体验的关键因素,需综合考虑
随着移动网络的发展以及移动智能设备的普及,尤其5G网络的应用,使得移动支付进一步成为大众的支付手段。为了实现房屋维修资金交存的信息化、科学化以及移动化,在移动支付发
中国对冲基金(私募证券投资基金)自2010年开始逐渐兴起,历经从无到有的艰难历程,至2014年迎来井喷式增长,实现蓬勃发展。时至今日,对冲基金的交易规模和资产管理能力已经达到
本学位论文主要研究了与赋权分数布朗运动(简记为wfBm)相交局部时导数(简记为DILT)的性质以及由赋权分数布朗运动驱动的非遍历Ornstein-Uhlenbeck(简记为O-U)的参数估计。全
随着中国经济的飞速发展,创业板应运而生,成为了我国高成长性新兴创新型企业筹资并进行资本运作的市场并逐渐成为了我国资本市场的重要组成部分。相较主板市场,创业板上市企
科学计算可视化能够将三维数据转换为具有丰富信息的图像,并进行交互处理。水声数据可视化便是其中的一个重要分支,主要应用于水下资源探测、沉船打捞以及渔业应用等方面。由
图像的超分辨率重建技术尽管使用更快,更深的卷积神经网络已在单图像超分辨率的准确性和速度方面取得了突破,但仍然存在许多问题仍未解决:一是当在较大的放大比例下进行超分