【摘 要】
:
直接将传统的分类方法应用于不平衡数据集时,往往导致少数类的分类精度低下。提出一种基于K-S统计的不平衡数据分类方法,以有效提高少数类的识别率。利用K-S统计评估分类与特
【机 构】
:
浙江工业大学计算机科学与技术学院,美国辛辛那提大学智能系统实验室
论文部分内容阅读
直接将传统的分类方法应用于不平衡数据集时,往往导致少数类的分类精度低下。提出一种基于K-S统计的不平衡数据分类方法,以有效提高少数类的识别率。利用K-S统计评估分类与特征之间的关系,去除冗余特征,并且构建K-S决策树获得数据分片,调整数据的不平衡度;最后对分片数据双向抽样调整,进行分类学习。该方法使用的K-S统计假设条件极易满足,其效率高且适用性强。通过KDD99入侵检测数据的分析对比表明,对于不平衡的数据集,该方法对多数类及少数类都具有较高的分类精度。
其他文献
针对图像分割中最优阈值的选择问题,在数据场机制的基础上提出了一种高维图像分割方法。将局部灰度特征与Tamura纹理度量相结合,如粗糙度、对比度、方向度等,尽可能提取足够的图像信息;将每个包含多特征的像素视作具有一定质量的质点,在图像特征空间上建立特征场;假设最优阈值为潜在的进化方向,通过因动态数据场中相互作用所导致的质点之间自适应吸引和排斥实现特征场的协同进化,并利用少数服从多数的投票法则确定最终
IEEE 802.11物理层和MAC具有支持多信道和多速率的能力。在多速率情况下,IEEE 802.11网络产生性能异常问题,低速率链路严重降低了高速率链路的性能,导致系统性能下降。针对该
为了保护海洋生态环境,减少遗弃的不可降解渔网造成的“白色污染”及“幽灵捕捞”的危害,研究开发环保可降解渔用材料已成为我国现代渔业可持续发展的重大问题之一。以可生物
目前已有构件规约大多是面向接口方法的型构和行为描述,其主要不足是缺乏针对业务逻辑的完整性描述,而这种规约描述的脆弱性直接影响到构件复用的效率。在需求分析和获取基础上
电池管理系统作为电动汽车的重要组成部分,其中准确估测荷电状态(SOC)和电池均衡管理是电池管理系统的核心功能,也是优化系统能量管理,提高动力电池的使用效率,延长电池使用
头足类具有生长快、世代更替周期短、资源量丰富等特点,既是海洋生态系统中重要的生物种类,也是世界海洋渔业开发利用的重要捕捞对象。为深入掌握头足类的生活史特性,认知种