论文部分内容阅读
群智能优化算法是受自然界中群居生物生活习性的启发而提出,用于解决复杂优化问题的算法,目前已成为解决优化问题的研究热点。人工蜂群算法(Artificial Bee Colony algorithm,ABC)是受蜜蜂觅食行为启发而产生的一种新型群体智能优化算法。与其他群智能优化算法相比,ABC算法具有控制参数少,全局探索(exploration)能力强,且易于实现等优点,现已被广泛应用于经济、社会、科学以及医学等众多领域。但该算法也存在局部利用(exploitation)能力差,易早熟收敛和所得目标函数值精度低等问题,故对基本人工蜂群算法的研究仍有开阔的前景。蛋白质被认为是生命的基本要素,具有维持生命的各种功能,这也使得蛋白质组学成为现代生物信息学中非常重要的研究领域。由于蛋白质根据其功能可以分为不同的类别,而同一类别的蛋白质具有相似的结构和性质,因此,研究蛋白质的分类对确定其功能具有重要的意义。本文在对人工蜂群算法进行性能分析和理论研究的基础上,提出了一种结合差分算子的人工蜂群算法,并探讨了人工蜂群算法在蛋白质分类中的应用。本文的工作内容主要包括以下几个方面:(1)人工蜂群算法基础理论研究。本文阐述了人工蜂群算法的研究背景及研究现状,深入研究了人工蜂群算法的生物学背景、基本原理以及算法框架,分析了人工蜂群算法与其他智能优化算法的优缺点以及适用范围,探讨了算法的时间复杂度,并选择了四种不同的基准函数来测试和分析算法的全局收敛性。(2)基于差分进化算子的人工蜂群算法研究。人工蜂群算法具有良好的全局探索能力,但局部利用能力较弱。与此相反,差分进化(Differential evolution,DE)具有良好的局部利用能力,但全局探索能力较弱。鉴于此,提出了人工蜂群和差分进化结合算法——AMDABC。AMDABC遵循人工蜂群算法的框架,包括雇佣蜂阶段、跟随蜂阶段和侦查蜂阶段。在雇用蜂阶段引入了两个DE算子(JADE算子、CoDE算子),同时给出两个控制参数,根据控制参数的值自适应地交替执行CoDE算子、JADE算子或ABC解搜索方程,以达到全局探索能力和局部利用能力的平衡。在跟随蜂阶段,同样结合JADE差分算子产生候选解,以更好地解决ABC算法局部利用能力弱的问题。19个标准函数上的实验结果表明AMDABC算法性能优于典型ABC算法、典型DE算法、典型ABC和DE结合算法。(3)基于人工蜂群算法优化支持向量机(Support Vector Machine,SVM)的MHCI类蛋白质分类研究。SVM的惩罚因子和核参数影响SVM的分类性能,因此可以通过优化算法参数来提高SVM的分类性能。本文提出了人工蜂群算法优化SVM参数的分类算法(ADA-SVM)。在该方法中人工蜂群算法的食物源位置表示SVM的惩罚因子和核参数,适应度函数用分类精度表示,搜索最优食物源位置的过程就是SVM寻找最优参数的过程。通过UCI数据库中的4个经典数据集实验确定了惩罚因子和核参数的最优预设参数范围,并与其他参数优化的SVM算法进行比较,实验结果表明本文提出的ADA-SVM算法的分类性能更优。最后将ADA-SVM算法用于MHC Ⅰ类蛋白质分类,通过实验方法确定RBF径向基核函数作为核函数。与其他分类算法的对比实验表明ADA-SVM算法具有更好的分类性能,对MHC Ⅰ类蛋白质的分类准确率可以达到98.45%,分类效果优于其他算法,证明了 ADA-SVM分类方法的有效性。