论文部分内容阅读
特征选择是为数据选择有效特征项以达到数据简化、提高数据处理效果的组合优化问题。根据对特征子集的评价标准,特征选择分为Wrapper方法和Filter方法两大类,两者各有优劣。
本文在深入理解两种方法本质的基础上提出一种结合方式,将Wrapper方法以数据处理任务效果为导向的优势和Filter方法中对数据本身信息的挖掘利用结合到一个整体框架中。研究利用蚊群优化算法可在搜索过程中引入问题相关信息的天然优势,采用蚁群算法按Wrapper框架进行特征选择,并将Filter方法中对特征子集的评价标准作为蚁群算法的启发式信息引入搜索中提供指导。研究在蚁群算法的路径搜索和信息素更新的具体操作上也提出一些新做法,使蚁群在特征子集空间中的搜索更灵活有效。
算法在多个标准UCI数据集上进行测试,并按有文献可考的方法进行比较实验,证明本研究所提方法稳定有效,可在较少的计算代价上得到分类精度高且特征顼数少的特征子集。