电力大数据检索方法研究

来源 :东北电力大学 | 被引量 : 6次 | 上传用户:zhangbaichi001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电力系统中,随着电力行业数字化、信息化的发展,电网数据来源多元化、复杂化,各种智能电表、传感器、信息系统等分布式数据源在发电、输电、配电、用电及调度、营销等多个环节持续不断地产生大量数据,促使电力数据呈几何级数增长。这些数据是建设稳定、可靠、高效智能电网的支撑性元素之一,它在揭示电力行业内部某些特有的规律的同时,反映着社会的经济发展状况,还对企业的长远发展有至关重要的作用,是未来电力发展的重要参考依据。本文主要对怎样利用数据分析技术在海量的电力数据中快速检索到有价值的信息进行了研究和探索。首先,分析了电力大数据检索的研究背景及意义,研究了当前国内外对电力大数据以及其检索方法的研究现状,并归纳总结了电力系统中大数据的来源、数据特点以及关键技术以及大数据检索方法和相关技术。其次,提出一种基于流形排序的电网截面数据检索方法。针对电网数据数量大、维度高的特点,考虑到在数据检索时多维度查询效率不高,检索结果无法多维度整体匹配的问题。本文提出的基于流形排序的检索方法,将电网截面数据描述成多维向量空间中的对应点,通过电力数据集的近似流形结构,使之与源查询之间具有较高的相关性,有效避免相关性度量对高维数据查询处理的不足。最后,构建一种适合电力数据特点的双层混合索引结构。考虑到电力数据中数据类型复杂多样,字符型和数值型属性并存,构建基于B+树以及倒排索引的双层混合索引,来完成对电力数据的检索需求。为适合大规模数据的处理需求,在上述提出的索引结构基础上实现索引的并行化,通过Hadoop平台在各个分节点计算机上构建本地索引,然后在主机节点端构建主索引,通过主索引定位本地索引,有利于减少数据的查询时间,加快查询速度。
其他文献
我国是世界上滑坡最严重的国家之一。由于滑坡会破坏或淹没农田、建筑物和道路,造成严重的经济损失和人员伤亡,所以滑坡的稳定性和加固方法受到学术界和工程界的广泛关注。经
随着计算机和网络社交媒体的快速发展,海量的多媒体数据在互联网上大量涌现,这给包括图像检索在内的多媒体信息处理带来巨大挑战。传统的基于内容的图像检索技术建立在底层视
自2011年《国家中长期教育改革和发展规划纲要(2010-2020)》发布以来,教育信息化受到国家的重视,翻转课堂就顺应了我国教育信息化的趋势,为教育信息化注入了新鲜的活力。翻转
<正>有效的沟通是提高护理质量的核心和关键。由于儿科的患者是一个特殊的群体,在护患沟通上存在多种障碍[1]。同时,儿童在现在的家庭关系中,多为一家之宝,如不能很好地与患
采用错误再认范式,考察了心理距离是否影响个体对他人行为的自发特质推理。实验1采用2(配对类型:图片-可推测的特质词、图片-不可推测的特质词)×2(空间距离:近、远)的混合设
痛经在临床上普遍存在,反复发作,治疗棘手,给广大女性带来痛苦。尉中民教授从事《金匮要略》教学工作40余年,先后被评为北京市名老中医和第五批全国名老中医,医德高尚,学验俱
民族传统体育是我国优秀民族文化的一部分,它体现着华夏儿女的生命力和创造性,也包含着中华民族特有的精神价值和思维方式以及想象力,炎黄子孙智慧和文明的结晶。毽球运动作为民
进化心理学家推测,自我认知是一组沿着不同进化历程发展起来的认知加工能力。史前人类的早期,自我面孔识别依赖于延展我的加工。我们对自我认知、自我意识的神经机制还知之不
本研究以概化理论为视角,搜集了新HSK五级模拟书写题的作答和评分数据,估算了试题、评卷员、评阅速度效应及其交互效应的方差分量,考察了五级书写成绩的可靠性。基于概化理论
对197个高三生施测《中学生数学学科自我监控能力问卷》和《高三学生数学思维品质问卷》,以探讨个体自我监控能力、思维品质对数学学业成绩的影响模式。结果:(1)自我监控能力