论文部分内容阅读
K近邻填充算法(KNNI)对缺失数据填充时,使用K个近邻的训练样本属性值的平均值作为KNNI算法的填充值,该值偏离真实值较大,一种有效的方法是K近邻样本属性值的加权平均值作为填充值。如何确定K近邻样本的权值,是KNNI算法研究热点。为此,提出引入局部线性重构方法用于近邻填充,该方法是用K近邻样本重构测试样本得出权值。实验结果表明提出的算法比KNNI算法填充效果更好,填充值更接近真实值。