基于主动学习不平衡多分类AdaBoost算法的心脏病分类

来源 :计算机应用 | 被引量 : 0次 | 上传用户:snrgw91924
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不平衡分类中小类样本识别率低问题,提出一种基于主动学习不平衡多分类Ada Boost改进算法。首先,利用主动学习方法通过多次迭代抽样,选取少量的、对分类器最有价值的样本作为训练集;然后,基于不确定性动态间隔的样本选择策略,降低训练集的不平衡性;最后,利用代价敏感方法对多分类Ada Boost算法进行改进,对不同的类别给予不同的错分代价,调整样本权重更新速度,强迫弱分类器"关注"小类样本。在临床经胸超声心动图(TTE)测量数据集上的实验分析表明:与多分类支持向量机(SVM)相比,心脏病总体识别率提升了5.9%,G-mean指标提升了18.2%,瓣膜病(VHD)识别率提升了0.8%,感染性心内膜炎(IE)(小类)识别率提升了12.7%,冠心病(CAD)(小类)识别率提升了79.73%;与SMOTE-Boost相比,总体识别率提升了6.11%,G-mean指标提升了0.64%,VHD识别率提升了11.07%,先心病(CHD)识别率提升了3.69%。在TTE数据集和4个UCI数据集上的实验结果表明,该算法在不平稳多分类时能有效提高小类样本识别率,并且保证其他类别识别率不会大幅度降低,综合提升分类器性能。
其他文献
"综合材料"走进中国有其必然性,是当代中国油画自身发展的内在需要,是不可逾越的一个阶段。因此,从中国油画的发展角度对"综合材料"在当代中国油画作品中的运用进行分析探讨
红菇属是一类药用和食用真菌。本文对红菇属的生物化学在国内外一些研究结果和进展加以综述,主要介绍蛋白质、多糖、脂肪酸、酶、氨基酸、甾醇、色素和抗生素等。
某住宅项目主楼之间为大型人防地下室,现场施工阶段需要在地下室顶板上设置施工道路及材料堆场。本文主要是针地下室结构承受上部大型车辆荷载的快速安全验算,方案优化。以及
社区矫正作为一种非监禁刑,是对我国原有刑罚执行方式的发展与完善,体现的是现代文明社会的法治理念,社区矫正的推行,是我国现代化建设的必然需求,但是,作为一个从国外引进的
近年来出现电子商务人才紧缺、招聘难、人才流失等问题,影响了农村电商发展,文章对农村电商从业人员工作适应性进行调查,分析农村电商从业人员就业环境、工作适应性及两者关
近些年来,心血管疾病引发的死亡已经持续成为居民首位死亡原因,而且,心脏病的患病人群也越来越年轻化。因此,心脏病的诊断与治疗已经成为医学研究的重中之重。心脏病种类繁多
农村电子商务的快速发展为实现农业发展与农民增收致富提供了新途径。当前,我国农村电子商务行业的人才匮乏,严重制约了农村电子商务的发展繁荣。湖南张家界农村电子商务行业
在阅读前人研究成果的基础上,本文以全国性及地方性报刊、教育官报、地方志、文史资料、近代教育资料汇编等文献为支撑,采用实证研究、量化分析、比较研究等方法,试图还原清
为制备猪瘟特异性抗体,将猪瘟兔化弱毒E2基因序列修饰后克隆到pFastBac1质粒载体,经转座、转染后构建重组杆状病毒,并用纯化的重组猪瘟E2蛋白免疫大耳白兔制备特异性抗体。实
<正> 在秦文化研究中,秦咸阳城布局形制是个重要课题,七十年代以来,在秦都咸阳遗址考古取得丰硕学术成果的基础上,秦咸阳城布局形制问题的研究也提上了日程,并为学术界越来越