电力系统垂直搜索引擎的研究与设计

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:s3100401
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
某供电局电力信息一体化平台整体结构复杂、信息量大,综合了设备台帐、电力生产、电力设备采购、电力管理办公、变电运行日志、无功管理、停电计划管理、电力培训等多个系统,但目前却没有一个统一的搜索引擎为该电力信息一体化平台提供查询检索服务,无法跨系统查询,需人工到各个系统查询并分析原始信息。这使得在如此庞大的电力信息一体化平台查找信息极不方便,为电力部门的生产和管理工作带来不便。   为满足电力部门工作人员对于信息查找的需求,快速地为其提供准确的信息,减少查找工作时间,节省人力成本,本课题通过综合分析供电局实际业务情况和电力信息搜索需求,研究了当前垂直搜索引擎技术,在某供电局电力信息一体化平台上,设计并实现了电力系统垂直搜索引擎。本课题首先针对电力系统垂直搜索引擎的电力主题相关特性,构建了电力系统专业词库、电力专业同义词词典,提高了电力系统中的中文分词的准确性,同时也可以提高信息检索的准确性;接着设计和实现了电力系统垂直搜索引擎的电力信息采集模块,针对Shark-Search算法忽略页面中的URL子节点间的主题结构相关性的不足,提出了改进的Improved-Shark-Search算法,通过引进URL子节点间的主题相关度平均值作为影响因子从而提高算法的有效性;然后设计和实现了电力信息结构化抽取和索引模块,通过模板定义和模板分类匹配的方法对电力信息网页中的信息进行提取并结构化,有效地聚合了电力信息一体化平台中的数据,解决了数据分散化问题;最后创建电力信息索引,构建了一个电力系统垂直搜索引擎,从而为电力信息一体化平台提供电力主题垂直搜索服务。   通过使用电力信息一体化平台中的真实数据对电力系统垂直搜索引擎测试,并与通用搜索引擎比较,证明了电力系统垂直搜索引擎在电力部门的海量信息资源中能准确快速地搜索信息,并反馈结构化信息,具有较好的查全率和查准率。
其他文献
车辆识别是智能交通管理系统的重要组成部分,同时也是数字图像处理技术、模式识别技术和计算机视觉等交叉学科研究的热门课题。目前,车辆识别系统主要是针对车牌进行识别,但