论文部分内容阅读
数据挖掘(Data Mining),即数据库中的知识发现(Knowledge Discovery in Database-KDD),是指从众多的数据中寻找那些具有特殊规律、特殊意义的并具有潜在应用价值的信息。数据挖掘是一个新型交叉学科,它融合了机器学习、人工智能、数据库等科学。在金融、经济、人口统计、生命周期等领域都具有广泛的应用。近年来,随着通信技术的发展,无线通信环境日益复杂,在较宽的频带上通常具有不同调制方式的通信信号,如何有效地识别这些信号的调制方式,是信号识别的重点研究内容,它在军事和民用领域都具有重要的应用前景。此外,随着科技的不断发展,对数据的处理提出了更高的要求,例如数据处理要求存储量更大、速度更快,处理离群点数据更准确等。聚类作为数据挖掘的重要组成部分,其发展也受到很大的关注,大部分聚类算法对于离群点存在的数据集,常常不能得出准确的结果。因此我们采用了COID算法(Cluster-outlier Iterative detection),通过簇和离群点之间的关系来检测离群点并进行合理聚类。为进一步提高算法实用性,对COID算法进行了改进,最后通过实验证明改进COID算法具有更好的可行性、有效性和准确性。论文针对几种典型的调制方式,将接收到的信号预处理后通过改进COID算法进行聚类,动态排除离群点并得到有效性评估函数值,将函数值作为特征参数输入支持向量机进行调制方式的识别。该方法在处理数据点时有很大的灵活性和智能性,可以在信噪比较低的情况下,较好的识别信号的调制方式,研究工作分为以下几个部分:1.介绍了数据挖掘中的几种常用算法,讲解了数据的特征区分、关联等概念,重点研究并阐述了聚类算法的分类情况以及它们的优缺点。2.基于常用聚类算法中不能处理离群点的缺点,采用了新的聚类算法COID,并在原来算法的基础上进行了探讨和改进,从聚类簇中心的选取,到迭代过程的准确性都做了深入研究。提出了启发式初始化独立的Prim簇中心算法,使运算过程更符合逻辑思维,最后通过大量的仿真实验证明改进的COID算法的有效性、实用性。3.将改进的COID算法结合支持向量机理论用于调制方式识别中,利用星座图特征参数的不同来识别通信中的信号调制方式。在低信噪比的情况下,可以较为准确的输出调制方式,识别率高于K-means聚类、原COID算法。