论文部分内容阅读
经典KNN算法和以住的基于密度的改进KNN算法都缺乏对训练样本数据分布的有效性描述,因此会间接影响到分类结果。提出一种基于测试样本近邻决策域内局部密度的改进KNN算法,通过计算备不同类别在近邻决策域内的局部密度,并同时考虑到类问偏斜度的存在,得到备类密度补偿系数和倾斜度平衡因子,从而达到削弱高教量、大密度类别,增强小数量、低密度类别的目的。在UCI数据集上的实验结果表明,该改进算法在保持经典KNN算法分类准确度的基础上,能够提高分类的召回率和F1-nleastlre指标。