基于遗传算法的关联规则挖掘在蛋白质结构预测的应用

来源 :汕头大学 | 被引量 : 0次 | 上传用户:wang8550cimc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,生物学领域中存在大量的蛋白质序列数据,而与之对应的蛋白质结构信息却相对较少,而且以往通过实验方法来确定蛋白质结构的过程十分复杂,代价较高,人们开始希望利用已有的蛋白质结构信息,来发现蛋白质序列和蛋白质结构之间的某种对应关系,从而实现蛋白质结构的预测。近年来在各个领域应用广泛的数据挖掘技术,其中的关联规则分析正好可以发现数据之间隐藏的关联规则集,因此,一种基于关联规则分析的蛋白质结构预测方法开始逐渐流行。  本论文的研究内容就是使用数据挖掘技术中的关联规则分析来发现蛋白质数据库中隐藏的关联规则集,从而建立蛋白质结构的预测模型,由于需要发现的规则的右部是确定的,所以涉及到的数据集与以往的事务数据库不同,如果用传统的关联规则分析方法,比如Apriori,就会产生很多没有任何意义的规则,另外考虑到搜索空间很大,本文结合了遗传算法,很好的解决了上述两个问题,而且在设计遗传算法时,改进了以往的轮盘赌选择方法,采用了一种基于适应值等间距分组的轮盘赌选择方法,保证了进化初期种群的多样性;另外改进了交叉、变异算子的设计方式,主要是通过与线性型自适应调整交叉率和变异率的策略作比较,提出了一种余弦型的自适应调整策略,改正了线性变换调整的缺陷,最后通过实验证明了该方法对于预测蛋白质结构是可行的,并对蛋白质结构预测做了总结和展望。
其他文献
伴随着神奇的“啤酒搭着尿布卖”的故事,数据仓库走进了中国人的视野。“啤酒搭着尿布卖”是一个经典的关于数据挖掘的故事,它告诉人们可以利用手中没有规律的数据,找出物与
随着Web Services的飞快发展,出现了如何在大量的Web Services中寻找服务之间的关联规则的问题。这是由于单个的Web Service功能非常有限,提供的内容也极为有限。本文从Web S
移动IP能在主机移动到Internet的任何区域都能保持与其他节点之间的通信,而IP组播可通过一次发送操作将大量数据传输到一组接收者,从而有效利用网络带宽,提高通信效率,在网络
本课题主要研究了物流自动化领域辅助拣货系统实现的一些理论、方法技术,包括:RS485总线的理论、技术标准,网络通信原理,单片机应用系统的组成原理,数据非易失性存储技术,单
统一建模语言(UML)是使用面向对象概念进行软件系统建模的一组表示法,它已被国际标准化组织吸收为软件建模领域的国际标准。基于UML的设计和开发过程越来越受到广泛的关注,但
随着高等教育事业的发展,高等教育规模扩大,校园治安问题日益突出。高校扩招、校舍扩建、多院校合并、扩大招生使高校建设进入了一个高速发展期。安全管理规范制度不健全,安全防
为了更快更好地推出新的语音业务,进一步降低运营风险,规范语音增值业务市场,加大对业务和内容提供商的监管力度,引入新业务的竞争,同时降低业务和内容提供商的接入技术门槛,以推动
一般说来,通信网中设备是由多个不同厂家提供,不同厂家设备的管理系统无法与其他厂商管理系统进行交互。随着通信网的逐步复杂化、智能化,对于能够管理多厂家设备的统一网管系统
在民航企业信息化建设迅速发展的今天,如何为公众提供一站式服务和实现民航企业间协同工作时的数据交换和共享,已经提出了多种解决方案。但已有方案运用于松散耦合,跨地域的民航
小波变换具有时频局部特性和变焦特性,而神经网络具有自学习、自适应、鲁棒性、容错性、和推广能力,如何把两者的优势结合起来,一直是人们关注的问题。小波网络就是结合了两