基于主动学习SMOTE的非均衡数据分类

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:jinhait2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
少数类样本合成过采样技术(SMOTE)是一种典型的过采样数据预处理方法,它能够有效平衡非均衡数据,但会带来噪音等问题,影响分类精度。为解决此问题,借助主动学习支持向量机的分类性能,提出一种基于主动学习SMOTE的非均衡数据分类方法 ALSMOTE。由于主动学习支持向量机采用基于距离的主动选择最佳样本的学习策略,因此能够主动选择非均衡数据中的有价值的多数类样本,舍弃价值较小的样本,从而提高运算效率,改进SMOTE带来的问题。首先运用SMOTE方法均衡小部分样本,得到初始分类器;然后利用主动学习策略调整分类器精度。实验结果表明,该方法有效提高了非均衡数据的分类准确率。
其他文献
本文针对农村中小学电子备课室使用及管理研究中一些问题提出"以人为本"的电子备课室的管理。
在我国现代化建设的进程中,企业资产管理对企业的发展有着越来越重要的意义。一个企业对资产管理的水平高低直接关系到企业在市场中的竞争力。本文从我国企业资产管理中所存
基于文献计量学的数据统计方法,对已出版的540多期《建筑学报》文章中的关键词进行筛选,甄别出诸如"民族形式""住宅"等词条,并辅以相关的统计分析图表,描述这些词条在60年间
<正>判定两直角三角形全等,除了判定一般三角形全等的方法SSS,SAS,ASA,AAS同样适用外,还有一种特殊的判别方法"HL".在判定两直角三角形全等时应根据要证明的结论、题设条件和
通过对我国注册环保工程师制度的分析,阐述了环境工程专业课程体系和教学内容的改革须与国家注册环保工程师制度相接轨、相适应,注重课程体系的实用性、发展性,以利于更好地
中国社会的转型正面临着进入社会发展的矛盾凸显时期。为此,党中央、国务院适时提出了构建社会主义和谐社会的战略构想。在城市化快速发展、"城市社会"即将来临的当今中国,要
移民语言文化的变迁与调适,是他们适应新的生活环境的产物。语言接触引发语言演变与语言适应。在移民与迁入地原居民发生互动的过程中,移民变化了的经济生活、政治身份以及文
陀螺系统是舰船、导弹、卫星等重要设备的定位和定向装置,其动态特性决定惯性仪表的工作精度和可靠性。实际工程中,常在陀螺定位系统与底座之间安装橡胶减振器来降低外部振动
在SERVQUAL模型以及软件工程产品质量模型的基础上,结合IT服务质量的内涵和范畴,提出了IT服务质量评价模型(ITSQEM);并对该模型特性及子特性进行分析,提出了模型裁剪原则以及
对学生进行数学思想的教学渗透是中学数学教学的重要任务之一,而数形结合思想是一种基本的重要的数学思想.对于含绝对值的不等式,最大的关键在于去绝对值,结合绝对值的几何意