论文部分内容阅读
孤立点检测是一项有价值的、重要的知识发现任务.在对大规模数据集中的孤立点数据进行检测时,样本数据集的选择技术至关重要.本文提出了一种新的基于密度的偏差抽样技术作为数据约简的手段,并给出了基于密度偏差抽样的孤立点检测算法,该算法可以用来识别样本数据集低密度区域中的孤立点数据,并从理论和实验两个方面对其进行分析评估,分析与实践证明该算法是有效的.