论文部分内容阅读
海量数据约简一直是数据挖掘、机器学习和模式识别等领域中的关键问题和研究热点,为此,在分析常用粗糙集约简技术和基于进化计算的约简技术基础上,研究基于量子粒子群(QPSO)和差分进化(DE)的混合优化(QPSO-DE)算法,进而提出基于QPSO-DE的海量数据约简技术,并进行典例仿真验证和实际应用。主要工作如下:(1)常用属性约简算法分析与仿真。对差别矩阵法和基于属性重要度的约简算法进行典型例子的仿真分析,指出了常用属性约简算法的缺陷与不足,即当所要约简的信息表数据维数超过一万时,现有约简算法是无法完成约简任务的,且其算法的复杂度会成指数级增长。(2)基于QPSO和DE的QPSO-DE算法研究。采用典例仿真分析,指出PSO、QPSO、DE三种优化算法存在之不足,即当处理一个多峰优化问题时由于算法中个体信息共享机制的单一以及种群多样性的单调导致算法搜索路径陷入局部最优。为此,将QPSO和DE相融合,提出一种QPSO-DE混合优化算法,大量实验表明它要优于现有进化算法。(3)提出基于QPSO-DE算法的海量数据约简技术,并进行实际应用。构建海量数据约简模型及适应度函数,采用QPSO-DE优化算法求解海量数据的属性约简集,典例仿真验证了其优越性。将之应用于测井信息处理,设计了一套基于计算智能的油层识别系统,实际应用表明,采用所提出的约简技术不仅快速求取样本约简集,而且能快速有效地进行系统建模与识别。