基于类中心插值的非均衡数据分类算法

来源 :通信技术 | 被引量 : 0次 | 上传用户:fishingalone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的随机森林算法中,随机森林由多棵决策树组成,分类的结果由所有的决策树共同投票决定。随机森林算法在训练决策树的过程中,单棵决策树训练样本的随机采样使得训练产生的决策树模型分类性能有所差别。训练样本的非均衡性会使随机森林模型更偏向大数据样本,使得小样本数据分类性能欠佳。为此,提出了KC-RF算法。该算法的过采样数据分为两部分:第一部分利用k-means对小样本数据进行聚类,在聚类中心周围根据欧式距离采样部分数据,用以表征样本;第二部分以小样本数据中心CM和大样本数据中心间的类间距作为标准进行样本插值。将
其他文献
考虑多路窄带干扰及非理想信道估计所造成的影响,采用常规的译码方法会使系统的信道适应力下降,降低与其他系统的兼容性,导致系统性能变差。因此,分析比特交织编码调制一正交频分
2009年1月4日,由国家863计划现代农业技术领域办公室主办、中国作物学会分子育种分会承办的“全国植物分子育种学术研讨会”在北京隆重召开。范云六院士等国内外农作物育种研
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
光信号的动态啁啾特性会引起光信号的波形发生独特的变化,以复杂的方式影响传输性能。为了分析这一特性,通过求解速率方程和光的传输方程和实验数据作比较,研究了QD-SOA的动
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
在对唐家山滑坡及其堰塞坝现场进行详尽地质调查结果基础上,结合早期(地震前)资料开展研究,结果表明,该滑坡形成及堵江过程可概括为:顺层岸坡结构地震诱发→滑坡体前缘剪切、
走进河北瑞兆激光再制造技术有限公司大门口,首先映入眼帘的是一幅大红标语:“弘扬军队优良传统,锻造忠诚高效团队”。总经理韩宏升曾在空军某部服役12年,2006年,他放弃在大连机场
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
依托基础学科的专业特色,积极探索构建跨学科的交叉培养新模式,以深化教育改革,提高研究生培养质量。
目的寻找踝关节外侧韧带于自然体位下MRI显示最佳的扫描方位。资料与方法首先解剖6例(12个踝关节)自然体位的正常踝关节标本,分离出外侧韧带,测量其走行角度,据此制定MRI扫描方案;