蛋白质8态二级结构以及抗癌肽预测的研究

来源 :内蒙古农业大学 | 被引量 : 0次 | 上传用户:sb871697914
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质的生物功能在很大程度上由它的空间结构所决定,所以要了解和掌握蛋白质的功能的前提是要先分析出蛋白质的空间结构。而蛋白质其二级结构识别的研究一般作为蛋白质空间结构预测的一个非常重要步骤。一般来说,蛋白质二级结构的预测工作主要是集中在蛋白质3态二级结构(alpha-螺旋,beta-折叠,无规卷曲)的预测上,但与蛋白质3态二级结构的比较而言,蛋白质8态二级结构能够提供更为细致的结构信息,也因此而更具挑战性,尤其对于那些低同源性的蛋白。本文针对蛋白质8态二级结构提出了一种新的预测模型,即基于多特征组合结合二次判别算法(QDA)进行预测。首先,选取了 200个蛋白,其氨基酸序列的一致性均低于30%,接着在200个蛋白中利用统计学方法提取6个原子的平均化学位移作为特征参量。然后,使用这些化学位移并结合6类亲疏水残基作为特征参量去预测蛋白质8态二级结构。最后,在七折交叉检验下,蛋白质8态二级结构的预测总精度(Q8)达到80.7%。在同一数据集中,对比了其他预测工具,比如:应用C8-Scorpion在线服务器进行预测,还有采用支持向量机算法(SVM)以及随机森林(RF)算法实施预测。结果显示:对于预测精度而言,我们的预测模型是优于其他预测算法的精度。抗癌肽是一种具有明显抗肿瘤活性的抗微生物肽,它们可以在体内快速地消灭有害病菌,同时对人体肿瘤细胞也有很大的抵制作用。如何有效地识别抗癌肽是近十多年生物医学研究的热点问题之一。本文在已发表的公用的抗癌肽数据集中,添加了蛋白质3种二级结构组分(3PSS)作为新的特征参量,并结合20种氨基酸组分(20AAC)和6类亲疏水氨基酸组分(6HP)作为特征信息,采用二次判别法(QDA)实施预测。在7折交叉检验下,当采用蛋白质3种二级结构组分(3PSS)结合6种亲疏水氨基酸组分(6HP)作为特征时,预测总精度(Acc)达到86%;当采用蛋白质3种二级结构组分(3PSS)结合20种氨基酸组分(20AAC)作为特征时,预测总精度达到94%。预测结果显示:氨基酸序列信息作为特征参数时,若添加了二级结构信息后,预测精度都有不同程度的提高。最后,在同种数据集中,与其他预测工作相比较,显示了我们的模型的优越性。
其他文献
Memcached是一个免费开源、高性能的、分布式的内存对象缓存系统,用于在动态Web应用中提升访问速度,在很多高访问量的大型网站中得到广泛应用。然而却一直没有一个对Memcache
为对 城市 生活 垃 圾焚 烧灰 渣 无害 化处 理和 资 源综 合利 用,针对 城市 垃 圾焚 烧灰 渣的 性 质 特 点,以 垃圾 焚烧 灰 渣 替 代 部 分 水 泥 原 混 合 材 进 行 试
冰水均温装置中的蒸发器采用立式螺旋管形式放置于冰水池内,螺旋管内为超倍的氨供液,管外用气泵往冰水池内鼓入气泡起到强制对流换热效果。本文通过对螺旋管蒸发器传热的理论
本文针对青主的古诗词艺术歌曲《清歌集》中十首歌曲进行分析,分别从歌曲体裁、题材、旋律特色、曲式结构、钢琴伴奏等方面,论述其对于古诗词艺术歌曲演唱的积极作用,及其作
电力系统中,变压器的差动保护负相序下,各侧电流相位关系会发生变化,对于差动保护效果产生一定的影响,本文以电流相序向量分析图的方式,对变压器差动保护负相序时的接线组别
<正> 约旦的建筑承包业年产值约占其国民生产总值的10%,容纳了全国劳动力的17%。约旦的建筑业承包劳务市场一直对外国承包公司开放。近几年来,中东承包劳务市场萎缩,发包项目
期刊
为解决荞麦在生产中产量和结实率较低的问题,本试验选用甜荞“丰甜一号”作为材料,采用喷施叶面肥的方法,探索不同类型和浓度肥液对荞麦结实率、产量和品质的影响,为荞麦生产
目的比较优生优育检查和不孕不育妇女的血清TORCH感染情况。方法对158例进行优生优育检查妇女和213例不孕不育妇女采用ELISA法检测血清中特异性TORCH系列IgM抗体。结果优生优
期刊