【摘 要】
:
为了提高不均衡数据集中少数类的分类性能,提出ISMOTE算法。它是在少数类实例及其最近邻少数类实例构成的n维球体内进行随机插值,从而来改进数据分布的不均衡程度。通过实际数
【机 构】
:
西北工业大学理学院,西北工业大学计算机学院
【基金项目】
:
国家自然科学基金资助项目(60873196)
论文部分内容阅读
为了提高不均衡数据集中少数类的分类性能,提出ISMOTE算法。它是在少数类实例及其最近邻少数类实例构成的n维球体内进行随机插值,从而来改进数据分布的不均衡程度。通过实际数据集上的实验,与SMOTE算法和直接分类不均衡数据算法的性能比较结果表明,ISMOTE算法具有更高的分类精度,可以有效地改进分类器的性能。
其他文献
本文论述了易拉罐用铝材的国产化过程.分析了易拉罐对罐体铝材的要求.并指出目前国内罐材质量存在的一些问题。
通过对河西灌区玉米不同种植模式的比较表明,全膜双垄沟播种植方式的玉米保墒、增产效果好,成熟期较对照(常规半膜平作)提前3 d,折合产量为18219.0 kg/hm2,较对照增产32.9%。
<正> 自从“非典”疫情在中国大陆爆发以来,国内外许多著名的经济学家、研究机构和经济组织纷纷调低了中国的经济增长率。悲观与乐观各有所见。 一、“非典”疫情不会改变中
应用彩色多普勒超声检测68例老年心脑血管病(观察组)和56例非心脑血管病(对照组)患者的颈动脉内膜—中层厚度(IMT)、斑块总积分、斑块总面积,以及血尿酸(UA)、超敏C反应蛋白(hs-CRP)和总
妊娠期肝内胆汁淤积症(intrahepatic cholestasis of pregnancy,ICP)是妊娠中晚期特有的并发症,以皮肤瘙痒,伴或不伴黄疽、血清总胆汁酸、甘胆酸及肝酶升高为主要临床特征,可致
介绍了峡江水电站的水轮机参数、水力设计及模型试验和结构设计特点。在水力设计方面,采用最先进的CFD计算软件,对过流部件进行优化,特别是转轮叶片,改进叶片进口头部的脱流,
高压直流输电系统以其诸多优点在现代输电网络应用中越来越广泛,根据具体的需求产生了许多电缆-架空线混合线路。实现线缆混合线路的故障定位,具有很大的实用性。鉴于单端行
语音教学是英语教学的难点问题,而原声影视作品自身存在的语音、环境等优势,为英语学习者提供了一个重要学习资源。本文从分析原音影视作品的优势入手,从当前原声影视如何作用于
批转、转发类公文生效标志后所附内容到底是不是公文的“附件”,要不要按照《党政机关公文格式》进行标注,学界争论已久,公文实践中屡屡出现省略标注的现象,并因此给二层或多
我国家谱源远流长、内容丰富、数量巨大,一直是众多领域学者关注的焦点。但是,家谱研究始终处于初级阶段,家谱的价值尚未得到充分利用。其根本原因在于家谱资源分布广泛、共享困