基于支持向量机的G蛋白偶联特异性预测研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:junjian1127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
G蛋白偶联受体(G protein coupled receptors,简称GPCRs)是生物体内最大的跨膜蛋白超家族,通过与G蛋白偶联,GPCRs在细胞内外信号跨膜传导的过程中承担着重要角色。GPCRs也是药物史上最有价值的药物靶标,在目前已知的药物靶点中,GPCRs靶点约占总数的50%。而目前针对GPCRs的药物多只针对30多种GPCRs,它们仅是GPCRs家族中的一小部分。因此挖掘GPCRs作为药物靶标有很大的空间。研究GPCRs-G蛋白偶联特异性可以帮助进一步了解GPCRs跨膜蛋白的功能和胞信号转导机理,从而为药物的研发提供新思路。   为了更大限度地挖掘GPCRs序列中所蕴含的结构功能信息,本研究首先从gpDB数据库中整理数据集,然后采用不同的特征提取方法对GPCRs不同序列区域进行提取特征,结合支持向量机方法,针对单偶联和多偶联分别构建模型。本研究的创新之处归纳如下:   (1)从gpDB数据库中整理出所有已知的GPCRs-G蛋白偶联信息,构建了本实验的GPCRs样本集。与先前研究相比,本研究包含更多GPCRs序列。   (2)GPCRs的每个胞内区域对偶联特异性结果的影响不同,本研究分别对每个区域进行实验。在先前的研究无相关的内容。   (3)对G蛋白单偶联和多偶联分别构建偶联特异性预测分类模型。目前的研究大多仅局限于构建单偶联分类模型。   在单偶联特异性实验中,本研究采用十重交叉验证和独立数据集方法验证单偶联模型的性能。十重交叉验证的总体准确率为91.8977%。独立数据集预测的总体准确率为96.063%。在多偶联特异性预测实验中,本研究采用五重交叉验证和留一法验证多偶联模型的性能。五重交叉验证的总体准确率为84.4595%,留一法验证法的总体准确率为84.4865%。实验结果显示,本研究采用的方法可以有效地用于G蛋白偶联特异性预测。
其他文献
交通标志牌作为一种重要的交通基础设施,可以为驾驶员和行人提供道路指引信息,规范驾驶员行为的同时也起到了便利交通、保障安全的作用。道路交通标志检测作为智能交通领域的一
随着智能拍照手机的普及和互联网大数据的兴起,场景文本识别的应用越来越广泛,诸如移动翻译系统、车辆识别、多媒体检索、盲人导航等。最近几年场景文本识别受到了广泛关注,未来
近年来,采用P2P模式解决流媒体服务系统的瓶颈问题受到越来越多的重视。如何在充分利用P2P网络中众多节点资源的前提下,确保流媒体服务质量、提高播放的性能,成为P2P流媒体技
IDP(Integrated Data-Service Platform)是开放的、模块化的、基于标准的基础平台,它向下提供与短信网关、彩信中心、BOSS (Business & Operation Support System,运营支撑系
近年来,随着无线网络技术的飞速发展,各种无线技术在相互竞争的同时,也正在逐步走向互补融合。未来无线网络发展的趋势必然是在保留现有各种无线技术的基础上,提供一种统一的
基于上下文的自适应二进制算术编码(CABAC)是H.264/AVC标准的一种熵编码方案,与另一熵编码方式基于上下文的自适应二进制变长编码(CAVLC)以及传统的VLC基线熵编码方式比提高了
在电子商务蓬勃发展的网络环境下,越来越多的关于商品的主观性评论文本出现在各类购物网站上。这些评论文本中包含用户对产品各个方面的情感倾向,如喜欢、讨厌等。对其进行情
人脸特征定位及对应点匹配是计算机视觉和模式识别领域一个非常热门的研究方向,它是人脸识别、人脸动画、人脸跟踪、三维人脸重建、立体匹配以及建立统计模型等的前提步骤之
相比较传统全文搜索引擎,垂直搜索引擎可以为用户提供更专业、更准确的知识,避免用户在大量的数据中筛选与专业相关的知识,是搜索引擎的研究热点和发展趋势。目前垂直搜索引
人脸分析是当前计算机视觉、模式识别和机器学习等领域的热门研究课题之一,得到了广泛的关注。人脸分析主要通过人脸图像来分析出人脸的各类信息,如:人脸身份、人脸表情、人脸