基于SVM和K-means算法识别蛋白质结构域

被引量 : 0次 | 上传用户:MM27291457
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构域是组成蛋白质的基本单位,但是专家们却无法对结构域进行明确、清晰地定义。从而,对于蛋白质结构的认识和结构域划分成为了一个具有挑战性的难题。随着蛋白质数量的不断增加,拥有更加复杂结构的蛋白质在数据库中的比例也不断增加,因此,评估结构域识别算法的数据集需要进行更新,同时更加全面地识别蛋白质结构域的算法亟待构建。本文中结合使用了3个方法:支持向量机(SVM),主成分分析(PCA)和K均值(K-means)方法来识别蛋白质中的结构域,并提高了蛋白质结构域划分的准确率。在一致性小于30%的非冗余SCOP数据集上的准确率能够达到80%左右,在Holland et al.[1]提出的标准数据集2和3上的准确率分别达到84%和85%。在现有的结构域识别算法[2]中,准确率有适当的提高,对蛋白质结构域的识别能够提供一定的支持。
其他文献
教学体系,是由教育理念与构成教学系统的诸要素组成的一个整体.涵盖教育思想、师资队伍、教学内容与课程体系、教学方法与手段、教学管理与教育评估等.优化各要素以及各要素
对于一个国家的大学系统来说,研究型大学的质量、数量是决定系统的整体水平和社会贡献程度的重要影响因素.从对研究型大学的作用与主要任务的认识之角度出发,可以认为具有较
“地摊经济”是为消减疫情对国民经济的不利影响而作为复工复产的一项措施而实施的。地摊行为作为一种过渡性质的实践形态,具有缓解就业压力、满足基本消费需求等积极作用。
李强教授,您好!非常感谢您接受我们的采访,您是社会学的知名学者,我们想请您谈一谈有关社会规范的理论问题。社会规范是为了保障社会生活需要而确立的基本守则,是社会生存和发展的必备条件。请您谈谈理论界有关社会规范的研究有哪些?您是如何理解和界定社会规范的?您认为关于社会规范的前沿问题研究包括哪些?
目的研究2型糖尿病伴慢性心力衰竭患者心电图Q-T间期离散度(QTd)与心脏不良事件的关系。方法以2016年2月~2017年12月河北省衡水市哈励逊国际和平医院收治的2型糖尿病伴慢性心
中苏之间在斯大林问题上的论战,实质是一场关于真假马克思主义的争论.中苏论战直接导致两党两国关系的恶化和破裂,在苏联国内和国际共产主义运动中造成严重思想混乱,它促使中
12月12日,在主题为"万物·云集·生长"的融资发布会上,云集微店对外宣布完成由凯欣资本领投,钟鼎创投跟投的2.28亿元A轮融资,创下2016年社交电商领域的最大一笔融资。
期刊
<正>矿产资源是一种不可再生的宝贵资源,是人类生产生活资料的重要来源,是国民经济和社会发展的重要物质基础,对矿产资源科学的开发与利用能促进经济社会全面协调可持续发展
会议
中国存在大量建于不同年代的既有建筑,其中包括不可再生的古建筑,需要开发和再利用的旧城区旧工业区建筑和大量使用期内的一般建筑.很多既有建筑在耐久性、安全性、节能性、
在微波辐射下,以对氨基苯磺酸为催化剂,环己烷为带水剂,合成了环己酮乙二醇缩酮。考察了催化剂的用量、反应时间、酮醇物质的量比、带水剂的用量及微波功率等诸多因素对产品收率