论文部分内容阅读
讨论大数据不平衡样本集的5种重采样方法,对电力违章事故事件大数据不平衡样本集进行平衡处理,并讨论不平衡样本集训练机器学习算法的多个性能指标;以此为应用大数据不平衡样本集训练和比较机器学习算法,以及为选择性能较好的机器学习算法提供决策信息;所阐述的研究方法,对大数据分析及机器学习算法分类器模型的研究及应用具有普遍的参考价值和意义。