论文部分内容阅读
对用电大数据进行快速、准确、高效的挖掘,是得到用户负荷模式不可或缺的基础工作。首先分析了用电数据的分布特点,利用统计学中四分位法的快速性和3σ法的精确性,提出了一种“横向—纵向”检测法,对异常用电数据进行检测与修正;其次,在综合对比了几种典型降维方法的基础上,采用主成分分析法对海量高维用电数据进行降维处理将极大地提高负荷模式提取效率;最后,对传统K-means算法进行改进,得到一种Fast K-means(FK-means)算法,该方法为减小聚类时间引入二分法思想,为提高聚类结果可靠性,将聚类有效性指标D