【摘 要】
:
随着大数据时代的来临,传统的实体识别技术由于电网数据体积大以及类型复杂等特性已经无法有效地进行数据预处理。近年来兴起的Hadoop技术能够对大数据进行较好的处理。因此
【机 构】
:
东北电力大学信息工程学院,国网内蒙古东部电力有限公司信息通信分公司
【基金项目】
:
国家自然科学基金资助项目(51277023), 吉林省科技厅社发处重点科技攻关项目(20150204084GX)~~
论文部分内容阅读
随着大数据时代的来临,传统的实体识别技术由于电网数据体积大以及类型复杂等特性已经无法有效地进行数据预处理。近年来兴起的Hadoop技术能够对大数据进行较好的处理。因此提出一种基于Hadoop的电力大数据属性实体识别算法。该算法利用改进离散化算法选取出信息准确率较高的离散点,并提出了一种离散化评价指标。最后,在Hadoop平台上对某风电机组的监测数据进行了属性实体识别。实验证明,该算法在实验正确性和断点数目方面表现良好,并且具有较好的加速比,适用于电力大数据的属性实体识别处理。
其他文献
内部控制是现代企业管理的一项重要手段,是企业防范风险、实现经营目标的重要举措,在企业发展中具有十分重要的作用。近些年来,国内的中航油、三九集团等事件的发生,暴露出我国国
一、驾校实行独立企业法人制度的目的与意义我国的机动车驾驶员培训机构(以下简称"驾校")发展到现在已经有几十年的历史。建国后成立的驾校主要以职业驾驶员培训为主,一般取名为"
以固体氧化物燃料电池发电系统为研究对象,以释放变换器上电感能量,减少电容充电时间为目的,提出了在DC/DC变换器中增加一个反激式绕组。该反激式绕组的输出端、接地端分别与