论文部分内容阅读
本文提出一种处理不平衡数据集的方法,即首先采用Tomekhks算法去掉噪声数据点和边界区域样本点;然后采用聚类融合算法对多数类样本中聚类一致性较低的中心区域样本进行US欠抽样;将抽样结果与少数类数据合成新数据集训练ELM基分类器,采用投票发集成分类结果。通过实例分析,本文方法可以有效提高对少数类样本的分类性能。