【摘 要】
:
不平衡数据分类是机器学习研究领域中的一个热点问题。针对传统分类算法处理不平衡数据的少数类识别率过低问题,文章提出了一种基于聚类的改进AdaBoost分类算法。算法首先进
【机 构】
:
佛山科学技术学院电子与信息工程学院; 佛山科学技术学院信息与教育技术中心;
【基金项目】
:
广东高校优秀青年创新人才培养项目(2013LYM_0097);佛山市智能教育评价指标体系研究(DX20120220);佛山科学技术学院校级科研项目
论文部分内容阅读
不平衡数据分类是机器学习研究领域中的一个热点问题。针对传统分类算法处理不平衡数据的少数类识别率过低问题,文章提出了一种基于聚类的改进AdaBoost分类算法。算法首先进行基于聚类的欠采样,在多数类样本上进行K均值聚类,之后提取聚类质心,与少数类样本数目一致的聚类质心和所有少数类样本组成新的平衡训练集。为了避免少数类样本数量过少而使训练集过小导致分类精度下降,采用少数过采样技术过采样结合聚类欠采样。然后,借鉴代价敏感学习思想,对AdaBoost算法的基分类器分类误差函数进行改进,赋予不同类别样本非对称错分损失。实验结果表明,算法使模型训练样本具有较高的代表性,在保证总体分类性能的同时提高了少数类的分类精度。
其他文献
循环物流是一个较新的概念,是研究解决资源短缺和减少对环境破坏的物流,是循环经济的重要组成部分。本文阐述了循环物流的基本含义和特征,分析了发展循环物流的必要性,提出发展循
人口、资源、环境的协调、可持续发展问题,是当今世界普遍关注的焦点问题。建设节约、环保型社会,应该成为全社会共同的价值取向。在物流管理领域,研究发展循环物流,对推进节
随着因特网向宽带、高速、广域、多媒体方向迅速发展及其应用需求的不断提高,为社区民众提供一个打破时空限制的,基于网络的公共学习环境成为可能。社区网络学习室,是以现代
婚姻、家庭是作为社会的人与他人产生社会关系最直接最初始的形式。在爱情的基础上缔结婚姻、成立家庭、繁衍后代是人类自身发展的永恒方式。青年,由于特殊的心理和生理特点,决
本文选取汉墓中出土的建筑明器为研究对象,通过对其墓葬属性和表现形式的考察,主张将建筑明器看作观念的建筑和表现建筑的艺术形象。本文首先从建筑明器与墓葬的关系出发,通
兴于清嘉道年间的全形拓是一种中国传统绘画形式,它以墨拓为主,结合绘稿、剪纸等技术,运用透视、墨色浓淡变化,尽可能完整地展现器物形体。目前大部分研究,以全形拓技法介绍
目的:呼吸道病毒感染性疾病是威胁人类健康的常见病、多发病。病毒疫苗只能预防特异的某些病毒却不能适应病毒不断变异,而且针对呼吸道病毒的西药既有较强的毒副作用,又容易诱
<正> 临床上无法治疗的神经性耳聋和经过治疗但无效的传导性耳聋患者都应该尽早选配助听器。大多数神经性耳聋患者的症状是,听得到说话的声音,但分辨不出说话的内容,看电视只
本文针对8度区高度超200m的某建筑结构,通过大量计算分析及提出的四项评判准则得出了采用筒中筒结构体系是较合适结构方案的结论;分析表明多筒结构能有效缓解剪力滞效应,从而
某3层框架结构工业厂房,因使用功能改变,要求加层改造为6层框架结构的学生公寓。对结构直接进行加层需要解决的问题有:部分框架柱轴压比超限,部分框架梁配筋不能满足使用要求