基于伪氨基酸成分的蛋白质多标签分类预测研究

来源 :景德镇陶瓷学院 | 被引量 : 2次 | 上传用户:zhenzhurujun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是维持生命活动的重要物质基础。近年来,随着生物科技的不断发展,蛋白质数据量呈现出海量增长的趋势,依赖于纯生物实验的方法已经不能够满足人们对于蛋白质结构和功能研究的需要。为了缩短研究周期和节约宝贵的研究经费,生物学家越来越依赖于生物计算的方法来预测蛋白质的众多属性。蛋白质功能类型分类及亚细胞定位问题作为蛋白质组学的一个重要分支,(?)年来受到了越来越多的研究者的关注与追捧。然而,目前对蛋白质属性的研究大多基于单标记这一前提,即假定一种蛋白质只具有某一种特定的属性(类型特征)或只存在于某一种亚细胞器当中。但随着数据量的迅猛增长,这一前提已经不能很好地反映真实的情况。因为有许多的蛋白质能够同时具有多重属性或同时存在于多种亚细胞器当中。具有这种特性的蛋白质可能会对新药开发以及疾病的治疗发挥更重要的作用,所以成为基因药物设计和基础研究的重点。为适应这种趋势,本文基于多标签学习方法,通过整合多种伪氨基酸组成的特征提取方法,对膜蛋白功能、多功能酶、抗菌肽分类问题及革兰氏阳性菌亚细胞定位问题进行了预测器设计,取得了一些较为欣喜的结果。我们所设计的预测器比现有的预测器预测成功率有所提高。希望本文的研究能对生物医药的发展起到一定的促进与推动作用,也希望本文的一些研究方法能够应用于一些其他的研究领域。
其他文献
近年来随着磁悬浮技术的引入,磁悬浮离心式集成冷站在国内逐渐成为研究热点,磁悬浮离心式集成冷站系统主要由磁悬浮主机制冷系统、冷却水循环系统、冷冻水循环系统及空气处理
水生植物降解对湖泊生态系统的碳、氮、磷养分循环以及湖泊群落演替有着非常重要的作用。在水生生态系统中,植物残体被动物牧食或者被微生物降解,过多的植物残体降解会向水体
各种非生物逆境胁迫包括干旱、高盐、极端温度等严重影响植物的正常生长和发育,特别是对农作物产量和品质的影响尤为突出。植物在长期进化过程中形成了精细的调节机制,如通过
热休克转录因子(Heat shock transcription factors,HSFs)或称为热休克因子,广泛存在于真核生物细胞中,是在功能和结构上同源性很高的一种转录因子。当细胞遭受热休克或其他环
纤维素酶是水解纤维素及其衍生物等多糖生成单糖的一类酶的总称,能够解决自然界中纤维素类物质燃烧造成的资源浪费和环境污染的问题。内切葡聚糖酶作为纤维素酶的重要功能成
姿态检测是水下无人潜航器导航控制的基础。利用多传感器数据融合算法准确测量AUV的姿态信息,做出相应控制信息,保证AUV的基本航行是极为重要的。本文针对现有的多传感器数据融合算法的局限性,重点研究了适用于非线性系统下的无迹卡尔曼滤波算法,提出了基于AUV姿态检测的多传感器数据融合算法,通过自适应策略调整噪声协方差,提高融合算法的准确性,并通过实验对其性能完成验证。本文首先分析了数据融合算法的发展现状
语体是调节听者和说者之间交际距离的一种语言机制。基于语体语法理论,本研究主要探讨在汉语普通话正式体和非正式体中,句中焦点和句末焦点的不同焦点编码方式。实验被试共有20名,其中10名播音员(5男5女),10名非播音员(5男5女)。10名播音员均为播音专业的学生或者老师,受过至少两年的专业播音训练;10名非播音员均出生于北京,汉语普通话为二级甲等及以上。根据正式度,实验语料分为正式体和非正式体。基于给
大型拖拉机作为农耕的重要工具,在多种复杂环境下作业是考验拖拉机作业性能的基本条件,而拖拉机耕深控制是现代农业机械发展的一项重要技术。目前,我国对于拖拉机耕深控制的研究局限于耕深调解方案的单一因素上,而多因素的研究较为浅显。因此,本文针对实际作业环境并结合拖拉机电液悬挂系统的特点,构建了一种基于滑模变结构控制的阻力-位置-滑转率三参数调节的耕深控制方式,可有效提高耕作质量。对大型拖拉机耕深控制方案进
在网络时代,网络安全形势日益严峻,但传统网络安全技术面对复杂多变的网络环境愈加乏力,网络生存技术研究刻不容缓。基于网络拓扑的复杂网络理论为网络生存技术研究提供了有
本文研究了伪欧氏空间En+1/1中具有至多三个不同主曲率且满足方程△→/H=λ→/H的超曲面Mn/r,并得到其平均曲率为常数.这个方程是2-调和子流形方程△→/H=0的一个自然推广为