面向不平衡数据的三支决策混合采样算法研究

来源 :山西大学学报(自然科学版) | 被引量 : 0次 | 上传用户:wuqianlan987654
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不平衡数据采样算法效率低及分类效果不理想等问题,提出一种基于三支决策的三支等价粒混合采样算法(3EG-HS).利用二元关系粒化不平衡数据集,实现三支等价粒划分,形成正等价粒、不确定等价粒和负等价粒.采用马氏距离(Mahalanobis distance)剔除负等价粒中价值密度低的多数类样本,实现负等价粒欠采样.应用SMOTE算法对不确定等价粒中的少数类样本实施过采样计算,提升价值密度高的少数类样本比例.合并正等价粒、过采样不确定等价粒和欠采样负等价粒,形成新的混合采样数据集,降低数据集的不平衡比.仿真实验结果表明,与其他采样算法相比,该算法总体性能表现优秀,根据模型评价指标,不仅G-mean值在大部分数据集上提升了 5%~10%,而且F-measure1在9个数据集上得到了提升,数量上明显多于其他方法.
其他文献
为了吸引用户,最新的推荐算法注重于所推荐物品的新颖性和推荐列表的多样性.而传统的基于协同过滤的推荐算法只专注于提高准确性使得推荐的物品列表种类单一,因此在保持准确
少层过渡金属双硫化物(TMDs)由于独特的光电性质,受到了人们的广泛关注.许多工作都是通过在机械剥离的少层TMDs上电子束刻蚀后蒸镀金电极制备门电极来改变材料的载流子浓度,
金属活性位点的浸出和聚集是传统金属负载型催化剂常见的问题.基于此,利用双氰胺与酞菁复合前驱体一步法热解合成了一系列不含金属的氮掺杂层状碳催化剂.通过透射电镜、X-射
利用生物质碳源麦秸秆和氮源乙二胺,通过一步水热法制备出氮掺杂的荧光碳点(carbon dots,CDs).利用TEM、FTIR、XPS、紫外可见吸收光谱和荧光光谱等对其进行了结构、光学性能
以介孔空心碳球为载体,采用等体积浸渍法将酸和碱的液滴限域在其纳米空腔内,制备了具有较大反应界面的固体酸/碱催化剂,并用于水-油两相反应体系.通过TEM、SEM、N2吸附等测试
一氧化氮(NO)是一个重要的生物气体信使分子,主要产生于线粒体,参与了线粒体呼吸作用的调节并与溶酶体许多功能密切相关,其不正常的表达将导致线粒体和溶酶体功能丧失,从而引
通过溶剂热法制备得到了长度为100 nm,直径为60 nm的棒状锂离子电池正极材料磷酸锰锂(LiMnPO4).为了提高其电化学性能,使用不同含量的beta-环糊精与其球磨并碳化对LiMnPO4表
在有效质量近似下,结合外场对材料性质的改变,并考虑压电电子学相关观点,从计算上研究了外场对闪锌矿InAs/GaAs量子点光学性质的影响,并与实验结果进行了比对.结果 表明:形变
在自旋转变材料中,由于晶体场能量与电子配对能量的竞争,改变温度可使自旋转变材料在低自旋态与高自旋态之间转变.文章以自旋转变材料与顺磁金属(如Pt)构成的双层膜系统为研
采用绿色无害的淀粉作为稳定剂合成了纳朱Fe3O4粒子,并用于水中砷(As)的去除.结果 表明,水中砷主要存在形式为As(Ⅲ)和As(Ⅴ).Fe3O4纳米粒子对As(Ⅲ)和As(Ⅴ)都有良好的去除