论文部分内容阅读
数据挖掘算法可以从大量的数据中搜索出有价值的信息,常用的分析方法主要有分类和聚类。分类算法是一种有监督学习算法,需要先从训练集中学习分类标准,然后根据学习到的分类标准对数据集进行分类。聚类算法是一种无监督学习算法,它能够在无先验知识的条件下,找出数据集的分布结构,将数据集划分成多个簇。本文主要研究利用数据挖掘的调制样式识别及并行化实现。首先,介绍了数据挖掘算法和调制样式识别的研究背景和关键技术,并详细介绍了k-means算法、DBSCAN算法和RBM模型。其次,推导了MASK、MPSK、MQAM和2FSK信号高阶矩的通用公式,计算得到2ASK、4ASK、QPSK、8PSK、2FSK和16QAM信号的高阶累积量理论值,并提取两个特征参数。提出了基于混合三阶受限玻尔兹曼机(Hybrid Three-order Restricted Boltzmann Machine,H3RBM)的数字调制信号识别方法。仿真结果表明,H3RBM训练时间短,信号识别率高。然后,提出了一种基于并行k-means算法的调制样式识别方法。采用随机抽样的方式将数据集划分成多个块;通过预聚类优化初始聚类中心,通过线性预测平均聚类中心加快聚类效率。该方法对2ASK、4ASK、QPSK、8PSK、2FSK和16QAM信号的识别不需要训练集。仿真结果表明,提出的并行方式具有更高的聚类效率,并且具有较高的信号识别率。最后,提出了一种基于并行DBSCAN算法的调制样式识别方法。利用粒子群算法搜索基于数据交叠分区的最优划分边界;每一数据块的聚类由粗聚类和粗聚类簇合并两个阶段实现,降低了计算复杂度;该方法对2ASK、4ASK、QPSK、8PSK、2FSK和16QAM信号的识别不需要训练集。仿真结果表明,提出的并行方式有效提高了聚类效率,并且信号识别率高于基于k-means识别方法和基于H3RBM识别方法。