论文部分内容阅读
特征选择作为信号识别中一个关键且具有挑战性的问题,在信号处理领域引起了越来越多的关注。特征选择是根据特征的可判别性对特征进行选择的过程。通过特征选择,可以缩小数据集和集中具有显著类别差异的信息,达到提高识别系统处理效果的目的。现有的特征选择方法大致可以分为两类:过滤法和包装法。在过滤法中,特征选择是独立于分类过程的。它采用一些间接的评价准则对特征集合的分类效果进行评估,具有较高的计算效率但准确度不高。而在包装法中,特征选择是依赖于分类器的。它直接通过分类正确率对特征集合的鉴别能力进行评估。相比过滤法,用包装法选出的特征进行分类可以获得更好的分类效果,但同时会增大计算的复杂度。遗传算法是一种以生物进化理论为指导的随机搜索策略。它具有稳定性强,对搜索空间的解析性质要求低的特点,打破了传统的最优化和启发式搜索策略的应用局限,为解决复杂的寻优问题提供了新的途径。遗传算法已成为特征选择中一种常用的寻优工具,基于遗传算法的特征选择方法得到了广泛的应用。本文结合包装法和过滤法的优点对特征选择的框架进行了设计,以类别可分离性准则F-Ratio作为遗传算法(GA)的适应度函数,提出了一种基于遗传算法的特征选择方法。并将这个方法应用于整个信号识别系统,来提高识别的效率和精度。主要工作如下:1.采用一种以距离的比值定义的类别可分离性准则F-Ratio来评估信号特征的分类有效性。在分析F-Ratio结构的基础上,将对数或指数函数加入到其分子(类间距离)或分母(类内距离)的计算公式中,来调整这两种距离对整个F-Ratio值的影响程度,得到一系列F-Ratio计算公式。2.在框架设计中,采用分类器返回的信息对间接准则F-Ratio的计算公式进行选择,再以F-Ratio为适应度函数对特征进行评价,相比直接用分类器返回的信息或直接用F-Ratio对特征进行评价,这种半独立于分类器的设计能更好地平衡效率和精度的要求。3.为了克服简单遗传算法的早熟收敛问题,本文将多种群并行和竞争策略引入到遗传算法中,并采用自适应的遗传算子。与简单遗传算法相比,改进后的遗传算法在全局搜索能力上得到了提高。4.将自适应调整的F-Ratio与改进后的遗传算法相结合进行特征选择,选出最优特征子集,并用这个子集作为分类器的输入。基于实时数据的实验结果表明,采用提出的特征选择方法可以得到分类有效性更高的特征子集,因而可以得到更好的识别效果。