论文部分内容阅读
特征选择能够根据一定的评价准则去除冗余的、无用的信息来实现数据降维,从而提高学习算法整体的运行效率和性能,因此其对于数据信息挖掘、机器学习等领域有着重要的研究意义和应用价值。基于演化计算的特征选择算法是当下特征选择领域的研究方向之一。现有的演化计算算法在特征选择领域取得了很多研究成果,也存在一些局限性问题。首先,许多研究大多采用比较传统的演化算法或者其变体,然而这类算法在寻优过程中往往有着时间效率低、早熟收敛等问题,将会影响算法的搜索寻优过程。其次,现有的研究大多对演化的操作算子做出改进,然而目标函数也会影响学习算法的寻优过程、分类性能以及后期研究成果的落地应用。针对上述问题,本文主要开展的工作有:(1)针对算法收敛性问题,本文提出了基于改进易经演化算法的特征选择算法。首先,利用易经演化算法解决优化问题的思想,提出了基于易经演化算法的特征选择算法来对原始特征空间进行搜索寻优。接着提出的基于改进易经演化算法的特征选择算法是在易经演化算法寻优过程中引入差分演化策略来加速算法的收敛,进一步提高全局搜索能力。最后通过UCI公开数据集进行实验来验证本文方法在准确率、精确率、召回率和特征缩减率等方面优于对比文献提出的方法,表明了其在解决特征选择问题上的有效性。(2)针对算法目标函数问题,本文提出了基于演化计算和归一化互信息的情绪相关特征选择算法,将基于改进易经演化算法的特征选择算法结合归一化互信息来研究脑电情绪识别中的特征选择问题。归一化互信息可根据数据的分布特点来筛选与类别高度相关而特征间低冗余的特征,可作为目标函数中度量特征的重要性指标。首先通过对特征提取后的脑电数据进行候选特征子集选择并建立情绪分类模型,同时设计基于归一化互信息的目标函数来对候选解进行性能评估,进而筛选出与情绪相关的优秀特征。实验结果显示了本文方法在DEAP数据库上采用5折交叉验证法达到平均愉悦度、唤醒度各为74.92%、74.89%的准确率,优于对比文献的方法,验证了算法的有效性和实用性。综上所述,本文所提出的特征选择算法具有良好的全局收敛性,能够有效地运用于特征选择问题;本文进一步提出的情绪相关特征选择算法采用基于归一化互信息的目标函数能够在脑电情绪识别研究中取得较好的识别效果,具有一定的实际应用价值。