基于k-modes聚类的不平衡数据混合采样方法

来源 :济南大学学报:自然科学版 | 被引量 : 0次 | 上传用户:license63
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有的不平衡数据处理方法存在不能有效处理分类型数据、盲目采样及抗噪声能力差等问题,提出一种基于k-modes聚类的不平衡数据混合采样算法HS_WODKM;首先提出一种基于加权重叠距离的k-modes聚类算法WODKM,然后采用改进的合成少数过采样技术(SMOTE)算法与WODKM分别对不平衡数据进行过采样与降采样处理,从而获得一种新的不平衡数据混合采样算法HS_WODKM;HS_WODKM采用增加正类样本并减少负类样本的混合采样策略解决样本类别不平衡问题,用来处理分类型数据,并且能够克服现有方法存在的
其他文献
国民政府外交政策追随美国,抗战结束后对日索赔从积极索赔到最终放弃;中日邦交正常化后,中国政府放弃战争赔偿,但国民赔偿并未放弃。中国必须提高综合实力,日本必须认识战争责任问
摘要:提出一种低功耗的基于时钟控制技术的三值D触发器(CG—TDFF)。CG—TDFF通过在电路中嵌入时钟控制技术,在输入信号不发生改变时抑制时钟链以减少触发器内部节点的冗余跳变,从
为合理利用地下深部废弃的水平盐岩溶腔储存油气,探测腔体三维地貌,设计了一种基于Visual C++6.0的探测器上位机监控系统。采用MSComm串口通信控件与VFW视频捕获技术,通过RS485标准串行接口和光纤实现上位PC机与下位单片机之间的通信,控制探测器运动,并实时显示电子罗盘航向角、电池剩余电量和盐岩溶腔三维地貌。该系统实现了地下深层水平盐岩溶腔三维地貌的实时监控,实际应用表明,该系统通信稳
为建立高效求解的植物病害诊断系统,利用经济学的多比例法实现设施蔬菜病害诊断知识数值化,依据蔬菜病害诊断问题特点,改进现有的层次分析法,利用诊断难易程度和影响病害发生
《C++面向对象程序设计》是高校(包括高职高专院校)计算机专业大学生的必修课,结合多年讲授面向对象程序设计的教学经验,探讨了该课程的教学内容、教学方法,并结合实验实训对实践教
通过对元认知策略使用情况的调查结果发现:学生在英语词汇学习过程中较少使用元认知策略;高分组和低分组学生在元认知策略使用上存在显著性差异。借重元认知策略增强学生的自主
从教育公平视野介绍了我国高等教育发展状况和公平问题。促进高等教育公平需要法律保障,明确政府发展教育事业的职责,优化教育结构,建立教育资源配制平衡机制,全面提高教育质量,加