论文部分内容阅读
免疫克隆选择算法是近些年发展起来的启发式进化算法,为解决一些复杂问题提供了一种新的方法,也吸引了越来越多群体智能算法研究者的关注和兴趣。近红外光谱分析技术是20世纪90年代迅速发展起来的一种快速、无损、可靠的检测分析技术,曾经一度被人们称为“分析巨人”。而近红外光谱异常样本识别则为近红外光谱分析的模型建立提供了可靠的数据保证。本文将从研究免疫克隆选择算法入手,以近红外光谱异常样本识别为最终目的,研究免疫克隆选择算法在近红外光谱异常识别中的应用。从多线程并行计算角度对免疫克隆选择算法进行改进,并在算法中加入记忆机制。对于这种算法不仅能够提高种群的多样性,并且对于免疫算法的收敛速度也有很大的提升。在抗体种群进化的过程中,同步实现了局部搜索和全局搜索。首先,将测量猪肉中水分、蛋白质、脂肪物质含量的近红外光谱数据按照1:4分成两份,1/5的数据作为测试集,4/5的数据作为校正集。通过使用并行免疫记忆克隆选择算法、标准的免疫克隆选择算法、遗传算法、马氏距离和留一交叉验证分别对校正集数据进行异常识别,从校正集的数据中删除各个方法识别出来的异常样本,对剩余数据使用偏最小二乘法进行建模,最后将测试集数据带入所建偏最小二乘模型,比较各个方法识别的准确性。通过实验证明:对于水分含量,并行免疫记忆克隆选择算法比标准的免疫克隆选择算法、遗传算法、马氏距离和留一交叉验证将模型的预测误差平方和分别降低了14.64%、36.64%、55.1%和55.1%;对于脂肪含量,并行免疫记忆克隆选择算法比标准的免疫克隆选择算法、遗传算法、马氏距离和留一交叉验证将模型的预测误差平方和分别降低了14.76%、53.49%、89.94%和83.9%;对于蛋白质含量,并行免疫记忆克隆选择算法比标准的免疫克隆选择算法、遗传算法、马氏距离和留一交叉验证将模型的预测误差平方和分别降低了16.31%、32.91%、52.43%和52.43%。实验表明,并行免疫记忆克隆选择算法不仅能够较为准确识别近红外光谱数据中的异常样本数据,而且还很大程度的提高了异常样本识别的识别速度,为下一步近红外光谱分析提供了数据保证。