一种新的近邻密度SVM不平衡数据集分类算法

来源 :贵州大学学报:自然科学版 | 被引量 : 0次 | 上传用户:hebehehe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出一种新的近邻密度SVM(NNDSVM)不平衡数据集分类算法。该算法先计算多数类中每个样本K近邻范围内的密度值,依据该密度值分别选出边界区域、靠近边界区域的与少数类数目相等的样本与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器迭代优化。人工数据集和UCI数据集的实验结果表明,与SVM、ALSMOTE-SVM和WSVM算法相比,本文算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能。
其他文献
饲用植酸酶酶活性的定量分析至今没有普遍公认的检测方法,本测定方法是在BASF公司1991提出的植酸酶活性的测定方法的基础上进行研究改进,建立了更适合于普通实验室条件下植酸酶
江泽民同志在最近一系列讲话中,反复强调领导干部要讲学习、讲政治、讲正气,并把讲学习作为讲政治的前提和基础,指出"有理论上的坚定,政治上才能坚定。"要求各级领导干部"一
本文基于多类型复发事件数据,提出了一类半参数变换模型,该模型包含了一些重要的半参数模型。利用广义估计方程的思想,对模型中未知参数和非参数函数进行了估计,并证明了估计
5月5日至9日,第二届数字中国建设成果展览会在福州市海峡国际会展中心举行,集中展示党的十九大以来我国电子政务和数字经济、数字社会、数字生活、数字生态领域的创新成果。
一、在企业政工工作的观念上,从"以我为中心"转变为以"经济建设为中心",服从服务于经济建设。在经济政治化,政治经济化的大背景下,为了适应党的基本路线的要求,适应以经济建
专家观点:上海财经大学金融学院院长戴国强:以往中国企业的“走出去”,往往出现两种扭曲的形式:一种是贱卖,国内能卖30美金的衬衫,到了国外只卖5美金,自跌身价,只是为了打出
首先以单硬币量子博弈理论为基础,结合经典同或门的逻辑关系,研究并给出量子同或门的定义;据此进一步利用单硬币量子博弈模型,提出了实现量子同或逻辑关系的理论方案,并将量
如果说,三四年前,社会上最热的是股票,那么,现在人们谈论的最多的则是电脑。翻开任何一张报纸,都不难看到与电脑有关的文字。在新闻栏里,我们会看到电脑业的最新进展,在科技
本文将2维圆形颗粒间的滚动阻力模型推广到非圆形颗粒体系,用于模拟准静态剪切实验,得到了满足率无关和客观性的剪切、剪胀曲线。给出的滚动阻力模型对Hertz接触模型和线性接
学生成绩是教学评估的一项重要衡量指标,考虑学生考试成绩特点提出了一种基于试卷难度系数变化的GM(1,1)修正模型,并运用此模型对花溪一中考试成绩进行预测,实践证明该修正模型