【摘 要】
:
SMOTE算法可以扩充少数类样本,提高不平衡数据集中少数类的分类能力,但是它在扩充少数类样本时对于边界样本的选择以及随机数的取值具有盲目性。针对此问题,将传统的SMOTE过
【机 构】
:
中国石油大学(华东)计算机与通信工程学院,中国石化胜利油田分公司信息化管理中心
论文部分内容阅读
SMOTE算法可以扩充少数类样本,提高不平衡数据集中少数类的分类能力,但是它在扩充少数类样本时对于边界样本的选择以及随机数的取值具有盲目性。针对此问题,将传统的SMOTE过采样算法进行改进,改进后的过采样算法定义为SDRSMOTE,该算法综合考虑不平衡数据集中全部样本的分布状况,通过融合支持度sd和影响因素posFac来指导少数类样本的合成。在WEKA平台上分别使用SMOTE、SDRSMOTE算法对所选用的6个不平衡数据集进行过采样数据预处理,然后使用决策树、AdaBoost、Bagging和朴素贝叶斯分
其他文献
为解决结构相似度算法的图像质量评价缺陷,提出了一种基于变差函数全局纹理增强的结构相似度图像质量评价。该方法首先利用改进的对数变差函数模型提取原图像和失真图像在水
针对传统特征加权方法未充分考虑词语之间的语义信息和类别分布信息的不足,提出了一种融合词语共现距离和类别信息的短文本特征提取方法。一方面,将同一短文本中两个词语之间
目的在中药保留灌肠的基础上联合中药外敷对溃疡性结肠炎的治疗效果,并总结护理经验。方法选择2012年3月—2013年9月收入消化科病房的溃疡性结肠炎患者80例随机分为观察组和
根据2014年2月26日国务院召开常务会议,部署加快以展现代职业教育,明确提出要"引导一批地方本科院校向应用技术型高校转型"的精神,[1]在这种背景下作为新建地方本科院校应积
本文首次对宝鸡虻(Tabanus baojiensis Xu)中具有较强抗血栓活性蛋白聚糖,采用TLC、GC、HPLC、电泳、Sephadex凝胶柱等方法对其结构中单糖、氨基酸组成及分子量范围,进行了分析
石材是人类应用最早也是最多的一种建筑材料,因其色彩斑斓,纹理自然,质感怡人而受到人们的青睐,并被逐渐应用到室内设计装饰中。本文主要探讨了石材的分类、属性和石材在室内
咳嗽变异性哮喘(CVA)是一种特殊类型的哮喘,中医籍虽无与之相对应病名,但据其以咳嗽为主症,病程缠绵不愈,及外感邪气、内邪干肺、内外合邪等不同的病因病机特点,多将其归属于