基于PCA-SMOTE-随机森林的地质不平衡数据分类方法——以东天山地球化学数据为例

来源 :桂林理工大学学报 | 被引量 : 0次 | 上传用户:underdog1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于PCA改进SMOTE算法,能实现不平衡数据集的均衡化,并以随机森林作为分类器,应用于地质数据进行分类与预测.因原始数据集中的噪声数据可能会引起插值后的数据分布形态的改变,故提出结合PCA算法与SMOTE算法,先进行除噪降维再进行数据插值,改善不平衡数据集的分类性能,并对东天山化探样本数据进行实验,结果表明,新算法能较好地提高分类精度,为地质不平衡数据的分类与预测提供新的思路.
其他文献
本文由毕奥——沙伐尔定律导出通电螺绕环内部横向(环平面方向)磁场不均匀,纵向磁场不为零,螺绕环外部磁场也不为零。文中由一个简单的模型给出螺绕环外部磁场的表达式。
目的:分析环乳晕切口用于治疗乳腺纤维瘤的临床疗效。方法:选取2017年2月~2018年2月在我中心诊治的乳腺纤维瘤患者80例进行治疗分析,按照就诊单双号分为试验组和参照组各40例
设计制作4根底部开槽并用具有不同张拉控制应力的CFRP-PCPs嵌贴加固梁,进行抗弯承载力试验。结果表明,加固梁的抗弯承载力明显提高,加固效果明显。依据平截面假定和材料的应
TR3001是RF Monolithics公司推出的单片OOK/ASK收发器芯片,它的工作频率为315.00MHz,接收灵敏度为-100dBm,发射输出功率为1.25mW,其OOK模式下的数据传输速率达19.2kbps,ASK模
通过对1994-1998年高考化学中 STS 试题的回顾及分析,认为进一步研究高考化学中STS 试题,加强其教学,势在必行.同时,就如何加强 STS 内容的教学提出了一些建议.
GRV090228陨石是一块经历了强烈冲击变质作用的普通球粒陨石。该陨石主体中,球粒结构不清晰,多为残余球粒,基质重结晶颗粒粒径达50μm,橄榄石和辉石的成分均一,根据特征将该
从古至今,人们的生活始终没有离开过货币,从远古时代的"贝壳货币"到现代的纸币、硬币、网络货币等,货币是一种等量兑换实物的载体,更是经济发展体系下不可缺少的一个重要模块。
滴定分析中的终点误差的计算方法,还没一个统一讨论的形式,络合滴定中林邦误差公式为学者们普遍采用,彭崇慧等应用类似公式于酸碱滴定中取得了很好的教学效果,陶德祥等在氧化
[摘要]目的:研究甲状腺功能亢进合并甲状腺癌患者采用甲状腺全切除手术方式进行治疗的临床效果。方法:选甲状腺功能亢进合并甲状腺癌患者76例,分成对照组和治疗组,平均每组38例。对照组采用甲状腺部分切除手术方式进行治疗;治疗组采用甲状腺全切除手术方式进行治疗。对比两组手术治疗效果、术后并发症情况、术后住院治疗时间、术后不同时间点疼痛程度VAS评分水平。结果:治疗组患者手术治疗总有效率达到92.1%。高