论文部分内容阅读
以入侵检测系统中的分类器设计为例,研究分类器训练样本选择问题.提出了一种大规模数据集的训练样本选择方法.首先通过聚类将训练数据划分为不同的子集,缩小搜索范围;然后根据聚类内离散度和样本的覆盖区域选择样本,保留每个聚类的边界样本,删除内部样本.仿真结果证实,由于保留了典型样本,减少了训练样本数量,从而保证了分类器的性能且训练效率较高.