【摘 要】
:
二十世纪九十年代,随着人类基因组计划的开展,极大地促进了基因组学和蛋白质组学的发展,人们获得了海量的氨基酸残基序列和蛋白质序列。但在蛋白序列数据迅猛增长的同时,蛋白
论文部分内容阅读
二十世纪九十年代,随着人类基因组计划的开展,极大地促进了基因组学和蛋白质组学的发展,人们获得了海量的氨基酸残基序列和蛋白质序列。但在蛋白序列数据迅猛增长的同时,蛋白质结构测定却显得相对滞后。膜蛋白约占整个蛋白质序列的30%,但却仅有1%的膜蛋白结构被测定出来。膜蛋白作为细胞膜的一部分,其已知的作为细胞间通信、调节细胞膜内外溶质与离子传输、细胞的“感觉器官”等功能在维持生物体正常运转中起着重要作用。由于蛋白质结构与功能之间密切的关系,如果能测得蛋白质的结构,那么就可以在一定程度上推断它具有的功能。膜蛋白受体作为绝大多数药物靶点,如能预先测得其结构特征,那么在新药物的研制过程中必会产生巨大的效益。
本文主要研究预测膜蛋白跨膜螺旋。目前,基于特定位置得分矩阵(position-specificscoring matrix,PSSM)的膜蛋白跨膜螺旋预测取得了比较好的结果。但是使用PSSM进行膜蛋白跨膜螺旋预测仅仅使用了序列进化信息,膜蛋白还有许多其他的物理化学性质也可以应用到跨膜螺旋预测中来。典型的如氨基酸的疏水性、分布倾向性都曾经作为基础信息用于跨膜螺旋预测。本文的中心思想是以PSSM为基础,分别引入氨基酸的疏水性、结构倾向性、分布倾向性并观察预测结果。具体做法是使用主成分分析(principal component analysis,PCA)对PSSM进行特征提取,获得包含序列进化信息的特征,并以此为基础,分别加入结构倾向性、疏水性、分布倾向性特征,应用特征融合的方法,对膜蛋白跨膜螺旋区域进行分类预测,得到了较好的预测结果。
标准数据集上的实验结果表明,本文基于多特征融合的方法在预测精度的五类评价指标上均有提升,特别是在末端准确率上提高明显,是一种有效的膜蛋白跨膜螺旋预测方法。
其他文献
Web 2.0的飞速发展使得人们在社交媒体中的参与度不断提高,随之产生的各种携带用户观点和情感的结构化与非结构化信息为研究者们提供了大量可研究的资源,对其进行情感分类可
在基于构件的系统中,随着用户需求、软件运行环境不断地发生变化,系统在运行中需要不停地进行更新,对于某些需要长期运行的关键业务系统,如卫星定位导航系统、金融系统等,这些关键
目前,随着移动智能终端设备计算能力不断增强与存储容量逐渐扩大,而其价格日趋低廉,使得移动智能终端设备得到大量普及。其中,流媒体终端应用日益为人们所喜爱。为移动智能终
电网是人们日常生活中的重要组成部分,为了保证电网的可靠、安全、经济的运行,同时也为了给低碳经济开辟道路,建设智能电网已成为当今发展的必然趋势,智能电网建设中的电力设备状态监测举足轻重,监测信息的实时通信也越发重要。本文中首先深入细致地研究和分析了IEC61850标准与制造报文规范的基本组成及特点,着重研究了IEC61850标准中的抽象通信服务接口模型的通信结构和服务以及特殊通信服务映射,而后依据I
随着虚拟现实技术和现代医学的快速发展,虚拟现实技术已被广泛应用到医学仿真中,形成虚拟手术仿真这一全新的研究领域。目前,随着现代医学的不断发展,内窥镜手术因其所具有的康复
传感器网络集成了传感器技术、嵌入式计算技术及现代网络技术于一体,一种新的信息采集和处理技术。无线传感器网络由于其前景广阔的应用前景而成为现代通信技术的一个新的研究
随着信息时代的到来,网络信息爆炸式增长,导致了各搜索引擎数据过载现象严重。如何快速有效地挖掘有用的知识,特别是提取网民对事件的情感、意见和态度等已成为重要的研究课
互联网的快速发展使人们的生活发生了巨大的变化,我们的生活被各种信息充斥着。各种媒体信息如文本、图像、音频、视频等每天都在大量地增加,而且随着时间的演化,相关的媒体
随着现代化信息技术的不断发展,设备的维护与使用所需要的技术资料的数量急剧增加,技术资料编写过程中的问题也日益突出。传统的技术资料编写形式已经不能够满足信息化发展的
随着信息技术的不断发展,全球信息存储量正在以57%的复合年增长率膨胀。大量数据密集型应用对现有的网络存储架构提出了更高的要求。对象存储技术同时具备传统SAN快速访问的