基于随机配置网络的多分类集成算法研究

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:huahongtao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题在生活中普遍存在。在二分类问题上,有许多成熟的算法得到了广泛的应用。但是关于多分类问题,特别是当类别较多并且数据复杂时,大多数的机器学习算法不能达到令人满意的分类效果。因此多分类问题存在很大的研究空间。神经网络方法凭借着出色的非线性处理能力和自学习能力而被广泛地用来处理多分类问题。最常用的为BP神经网络多分类算法。但是在面对大量的复杂数据时,BP算法存在收敛效率低,易得局部最优解和过于依赖初始值参数等缺点,所以有研究者在神经网络中加入了随机的思想,提出了随机权神经网络。随机权神经网络凭借着其收敛速度快、不易陷入局部最优、训练过程简单易于实现等优点而被广泛地研究和应用。随机配置网络(SCN)是一种特殊的随机权神经网络,其网络结构是在特定的监督机制下,根据训练误差最小化逐步生成的。随机配置网络解决了人为经验选择隐藏层节点数目的问题,并且灵活性更强。本文将SCN应用在多分类问题上。为了更好地处理多分类问题,做了如下改进:(1)在SCN模型中加入了L2正则化项,提高SCN的泛化能力;(2)采用更适合处理分类数据的高斯径向基函数代替Sigmoid函数;(3)当分类数据中类不平衡时,将会影响模型分类效果。所以根据代价敏感学习方法(CSL)提出了加权SCN算法(WSCN)。在进一步研究中发现:当多分类问题中类别较多,并且某些类别之间差距较小时,神经网络算法会不可避免地出现误分类的情况。所以本文在使用WSCN算法对原始数据进行初次分类后,根据概率得分最高对应的两个类别,将数据划分为若干个二分类的数据子集;然后使用分类效果较好的随机森林算法对若干个数据子集进行再次分类。最后根据随机森林的分类结果判断样本属于WSCN算法初次分类的前两类中的哪一类。最后在UCI网站上选取10个真实的多分类数据集进行实验验证。首先验证了加权SCN算法(WSCN)的有效性;然后分析了误分类的存在性和使用其他算法再次分类的一个必要性;最后将WSCN-RF集成算法与BP神经网络多分类算法以及随机森林算法等进行比较,结果表明:本文提出的WSCN-RF算法在分类精度上优于其他多分类算法。
其他文献
受世界经济增长放缓、国际市场需求低迷、国内消费市场难以短期启动的影响,GDP贡献率相对较高的“两高一资”行业可能再度出现投资高速增长状态。$$ 受近年来出台的一系列
报纸
目的分析急诊热性惊厥患儿急救措施与护理。方法选取我院收治的急诊热性惊厥患儿共104例,随机将其分成观察组和对照组各52例,其中对照组给予常规护理,观察组患儿给予综合性急
<正> 著名考古学家夏鼐先生曾说过:“中国是全世界最早饲养家蚕和缫丝的国家,长期以来曾是从事这种手工业的唯一的国家。有人认为丝绸或许是中国对世界物质文化最大的一项贡
美国德克萨斯州立大学一家酒精和成瘾研究中心的一项研究发现,喝酒能刺激大脑中某一特定区域,使人的记忆更加清晰。这为“借酒浇愁愁更愁”的说法提供了科学依据。人们普遍认
目的观察急诊小儿热性惊厥的急救措施与护理体会。方法选取热性惊厥患儿130例,随机分为对照组与观察组各65例.对照组给予常规护理干预,观察组患儿给予综合性的急救措施与护理干
我国的畜牧业近年来发展较快,但是发展过程中存在不足,集中表现为养殖动物的疾病和养殖管理问题,或者养殖者自身能力问题。文章结合当前实际情况,提出关于畜牧养殖风险管理的相关
填闲作物是指主要粮食作物收获后,在土地休耕期种植以提高土壤肥力,供后续作物生长的作物。本文采用田间尼龙网袋法研究了渭北旱塬不同填闲作物(长武怀豆(S)、黑麦草(R)及两者1:1混合(M))翻压和不同氮肥水平(0、60、120 kg N.ha-1)双因素处理下,填闲作物腐解过程、温室气体(CO_2、CH_4、N_2O)释放动态及对后续冬小麦产量、土壤碳收支的影响。主要结论如下:(1)各填闲作物翻压后
浙江省湖州市南浔区人民法院以违反居家隔离规定、妨害公务罪,判处王某某有期徒刑9个月,这无疑具有一定的警示意义。这不仅是对当事人的严惩,也是对其他人的一种警醒和威慑。“
报纸
针对传统设备检测和故障诊断方法的一些不足之处,着重讨论了专家系统在大型电机故障诊断系统中的应用及有关理论,提出了神经网络和自学习控制相结合的控制策略,大大提高了系统的
目的 探讨胰岛素样生长因子-1(IGF-1)、热休克蛋白70(HSP70)与新生儿窒息的相关性,及其在窒息诊断中的参考价值。方法 选择2013年11月至2016年5月在我院产科出生的足月新生儿146