人工蜂群算法的改进及其在蛋白质分类中的应用研究

来源 :东北林业大学 | 被引量 : 1次 | 上传用户:huoyong850918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
群智能优化算法是受自然界中群居生物生活习性的启发而提出,用于解决复杂优化问题的算法,目前已成为解决优化问题的研究热点。人工蜂群算法(Artificial Bee Colony algorithm,ABC)是受蜜蜂觅食行为启发而产生的一种新型群体智能优化算法。与其他群智能优化算法相比,ABC算法具有控制参数少,全局探索(exploration)能力强,且易于实现等优点,现已被广泛应用于经济、社会、科学以及医学等众多领域。但该算法也存在局部利用(exploitation)能力差,易早熟收敛和所得目标函数值精度低等问题,故对基本人工蜂群算法的研究仍有开阔的前景。蛋白质被认为是生命的基本要素,具有维持生命的各种功能,这也使得蛋白质组学成为现代生物信息学中非常重要的研究领域。由于蛋白质根据其功能可以分为不同的类别,而同一类别的蛋白质具有相似的结构和性质,因此,研究蛋白质的分类对确定其功能具有重要的意义。本文在对人工蜂群算法进行性能分析和理论研究的基础上,提出了一种结合差分算子的人工蜂群算法,并探讨了人工蜂群算法在蛋白质分类中的应用。本文的工作内容主要包括以下几个方面:(1)人工蜂群算法基础理论研究。本文阐述了人工蜂群算法的研究背景及研究现状,深入研究了人工蜂群算法的生物学背景、基本原理以及算法框架,分析了人工蜂群算法与其他智能优化算法的优缺点以及适用范围,探讨了算法的时间复杂度,并选择了四种不同的基准函数来测试和分析算法的全局收敛性。(2)基于差分进化算子的人工蜂群算法研究。人工蜂群算法具有良好的全局探索能力,但局部利用能力较弱。与此相反,差分进化(Differential evolution,DE)具有良好的局部利用能力,但全局探索能力较弱。鉴于此,提出了人工蜂群和差分进化结合算法——AMDABC。AMDABC遵循人工蜂群算法的框架,包括雇佣蜂阶段、跟随蜂阶段和侦查蜂阶段。在雇用蜂阶段引入了两个DE算子(JADE算子、CoDE算子),同时给出两个控制参数,根据控制参数的值自适应地交替执行CoDE算子、JADE算子或ABC解搜索方程,以达到全局探索能力和局部利用能力的平衡。在跟随蜂阶段,同样结合JADE差分算子产生候选解,以更好地解决ABC算法局部利用能力弱的问题。19个标准函数上的实验结果表明AMDABC算法性能优于典型ABC算法、典型DE算法、典型ABC和DE结合算法。(3)基于人工蜂群算法优化支持向量机(Support Vector Machine,SVM)的MHCI类蛋白质分类研究。SVM的惩罚因子和核参数影响SVM的分类性能,因此可以通过优化算法参数来提高SVM的分类性能。本文提出了人工蜂群算法优化SVM参数的分类算法(ADA-SVM)。在该方法中人工蜂群算法的食物源位置表示SVM的惩罚因子和核参数,适应度函数用分类精度表示,搜索最优食物源位置的过程就是SVM寻找最优参数的过程。通过UCI数据库中的4个经典数据集实验确定了惩罚因子和核参数的最优预设参数范围,并与其他参数优化的SVM算法进行比较,实验结果表明本文提出的ADA-SVM算法的分类性能更优。最后将ADA-SVM算法用于MHC Ⅰ类蛋白质分类,通过实验方法确定RBF径向基核函数作为核函数。与其他分类算法的对比实验表明ADA-SVM算法具有更好的分类性能,对MHC Ⅰ类蛋白质的分类准确率可以达到98.45%,分类效果优于其他算法,证明了 ADA-SVM分类方法的有效性。
其他文献
柔体机器人是由柔性材料构成的一类新型仿生机器人,理论上具有无限的自由度,结构复杂,理论分析困难。本文结合了分析力学和弹性力学的方法研究了柔体机器人系统的基本理论及N
随着计算机技术的发展以及智能手机与电子阅读设备的逐渐普及,电子文档已成为人们主要获取信息的方式之一。大部分印刷体文档是以图片形式进行存储的。得益于光学字符识别技
土地资源是人类生存最基本的自然资源,为国家和社会经济发展提供了物质保障。我国土地资源丰富、类型多样,获取真实准确的地物信息是对其进行合理开发利用的关键,对于及时规
文本情感分类是自然语言研究领域中的重要课题,目前对于文本情感分类研究多是基于情感词典和机器学习方法的,但它们在完成情感分类任务时割裂了文本中各词语间的关系,忽略了
滇越铁路是一条历史悠久、饱经沧桑的百年铁路,其文化遗产具有重大的价值。目前,法国、越南以及云南三方正积极开展滇越铁路申遗相关准备工作,申遗是一个漫长的过程。与此同时,由于对滇越铁路沿线文化遗产的重视程度不够,各类损毁时有发生,因此数字化展示不失为一种对滇越铁路现状保护的可行手段。基于以上背景,本文检索和分析了相关文献资料,研究了 HTML5、JS、Ajax、web应用框架、对象关系映射、信息推荐等
随着大数据时代的到来,多标签学习算法在图像分类、文本分类、音乐检索、生物信息学、多媒体自动注释等多个领域中得到了成功的应用。多标签数据集中的每个样本都由若干个标
目的:多种受体酪氨酸激酶蛋白在恶性肿瘤的发生发展过程中起重要作用。其中,EGFR在头颈鳞癌中广泛表达,是其最重要的治疗靶点。我们前期课题研究发现RET在口腔鳞癌组织中高表
本文以GF(2)上的n级m-序列为基础,根据改进自缩生成器模型,提出新型自缩控生成器模型,该模型利用相邻比特的模加值来控制具体比特的输出.设序列α∞为GF(2)上的n级m-序列,把
画面结构内含非常复杂,画面结构自古希腊时期一直延伸至普桑、塞尚,并且影响了20世纪的现代艺术。画面结构不单是作者客观再现的技法,同时也是作者平衡画面节奏的体现。除了
森林冠层图像可以反映森林生态系统中植物种群生长的各种参数,这些参数可作为生态学模型、全球生态系统变化模型的输入量,对生态系统健康状态和生产力水平、全球气候变化研究