【摘 要】
:
针对训练数据集的不均衡性这一问题,结合采样方法和集成方法,提出一种集成支持向量机分类算法。该算法首先对不均衡的训练集进行非监督聚类;然后依靠其底层的局部关注支持向量机
【机 构】
:
中国石油大学(北京)石油工程学院,武汉纺织大学传媒学院
论文部分内容阅读
针对训练数据集的不均衡性这一问题,结合采样方法和集成方法,提出一种集成支持向量机分类算法。该算法首先对不均衡的训练集进行非监督聚类;然后依靠其底层的局部关注支持向量机进行数据集局部划分,以精确把控数据集间的局部特征;最后通过顶层支持向量机进行分类预测。在UCI数据集上的评测结果显示,该算法与当前流行的算法(如基于采样的核化少数类过采样技术(K-SM0TE)、基于集成的梯度提升决策树(GTB)和代价敏感集成算法(AdaCost)等)相比,分类效果有明显提升,能在一定程度上解决数据集的不均衡问题。
其他文献
周杰伦的"御用词人"方文山继承和发扬中国传统文化,使其"中国风"歌词深具内涵,独树一帜。方文山的歌词承继了优良的传统文化并进行了精彩的现代转化,主要表现在四个方面:借助
<正>成都军区昆明总医院最近从美国购进了600张具有国际先进水平的多功能病床,这种多功能病床采用新材料新工艺制作,结构轻便精巧,移动灵活,美观大方,分为双摇柄和三摇柄两种
运用 MATLAB编程实现遗传算法,数值仿真验证了该实现方法的有效性,表明它能够对函数进行全局寻优。这种实现方法既可以熟悉MATLAB语言,又可以加深对遗传算法的认识和理解,以此来设计智能系统
以初始体重为(16.81±0.54)g的野鲤为试验对象,探讨饲料中添加一些添加剂对野鲤生长、体形、体色和肉质的影响。结果表明,添加螺旋藻组、肉碱组和联合添加组的平均增重率显著
【目的】揭示不同施氮量对滴灌冬小麦产量和品质的影响,为滴灌冬小麦合理施氮量的确定提供理论依据。【方法】在大田滴灌条件下,设置180 kg/hm2(N1)、240 kg/hm2(N2)、300 kg/hm2
在模因论的框架下,根据模因基因型和表现型的不同表现形式,结合英语搭配的不同种类,试图探讨模因复制和传播与词语搭配学习的联系。研究发现,对于隐喻的把握在一定程度上可以
如今,信息化已经成为社会发展的一个重要标志,思路决定出路,创新推动发展。企业档案管理是企业管理的一个重要内容,档案基础业务建设的重心已走向信息化、现代化转移,企业档
家电语音控制系统在复杂的背景环境下,由于识别率显著下降而导致关键词检出率偏低。介绍了利用孤立词、连接词以及连续语音识别引擎构造的多识别引擎的识别器,该识别器允许用
人类学引进中国后,如何用这一新的视角研究中国历史问题,成为中国人类学家们思考的热门论题。人类学强调对“异文化”的研究,这种由地理空间造成的“异文化”限制了人类学研
文章介绍了家用智能清洁器的发展背景和现状,并阐述了现有产品的不足。在对传统清洁器研究的基础上,提出了一款新型智能清洁器的设计,旨在提高其智能度和清洁效率。首先,在传