考虑类内不平衡的谱聚类过抽样方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:wanghui3321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不平衡数据分类问题是数据挖掘领域的关键挑战之一。过抽样方法是解决不平衡分类问题的一种有效手段。传统过抽样方法没有考虑类内不平衡,为此提出基于改进谱聚类的过抽样方法。该方法首先自动确定聚类簇数,并对少数类样本进行谱聚类,再根据各类内包含样本数与总少数类样本数之比,确定在类内合成的样本数量,最后通过在类内进行过抽样,获得平衡的新数据集。在4个实际数据集上验证了算法的有效性。并在二维合成数据集上对比k均值聚类和改进谱聚类的结果,解释基于两种不同聚类的过抽样算法性能差异的原因。
其他文献
婚姻满意度一直是婚姻经济学和家庭经济学的重要议题,但关于收入与婚姻满意度之间因果关系的研究较为缺乏。本文使用中国家庭追踪调查(CFPS)2014年数据,利用中国农村老年人60
初中阶段是英语学习的关键时期,初中英语除了培养学生的听说读写能力外,还要让学生学会熟练使用英语进行表达。将故事教学法引入初中英语教学,可以营造轻松有趣的课堂教学氛
光电行业生产过程所产生的有机挥发物不仅对人体产生危害,也成为影响产品品质的关键问题之一。本文综合论述了洁净间环境VOCs来源、扩散及浓度分布特性、处理工艺等,并结合案
土壤-植物系统内矿质营养元素的交互作用对作物的矿质营养有显著影响,研究烤烟-土壤系统内营养元素的交互作用意义重大。主要概述了烤烟中营养元素间的交互作用、营养元素间交
七氟烷是目前临床上广泛应用的吸入型全身麻醉药。除了麻醉作用外,七氟烷对学习记忆以及对术后认知功能障碍的影响在临床日益受到关注。七氟烷可以通过不同的受体和途径对学
目的:观察护理干预对预防患者术后便秘的效果。方法将41例腰椎间盘突出症术后患者随机分为干预组21例和对照组20例,两组均实施预防便秘常规护理,干预组在此基础上实施护理干预,包
地方叙事已经成为主题出版的一个重要叙事模式,在激发家国情怀、重塑社会主义核心价值观方面发挥着巨大作用。无论是从现实合理性来说,还是从发展现状来看,地方叙事有理由,并