论文部分内容阅读
知识图谱又称智能数据库,是人工智能技术与传统数据库相结合的智能知识管理体系。把知识图谱引入电力知识平台,将使得平台获得从大量文本中挖掘有用知识的能力,从而整合电力领域内零散的知识,提高知识利用率,服务平台内的使用者。论文围绕基于知识图谱的电力知识平台关键技术开展工作,具有重要的工程实践意义和工程应用价值。论文研究了智能电力知识平台的关键技术与相关设计、建设方案,主要对构建和更新知识图谱的概念对生成算法、实体对生成模型、平台系统功能设计和效益分析等几个不同角度进行了分析和应用。首先,针对常识抽取问题,研究了基于互信息的概念对生成排序算法,该算法借助知识库和概念分类体系能做到对给定的动词/关系r生成满足典型性优先排序的概念对,再从相似性角度考虑,对已获得的概念对利用马尔可夫聚类压缩算法可以生成多个概念对簇。算法引入了信息论中互信息的概念,以此解决概念或实体本身出现频率过高从而影响评价概念对典型性的问题。算法在知识库进行测试,能根据给定关系生成概念对,并获得较高(91%)的相关性准确率。其次,研究主动式的知识库更新技术,即基于已抽取出的概念对集合以及主题模式进行实体对生成。基于概率图模型,分析了在主题模式和概念模式下统一的生成机制,为了获得两种机制下统一的实体对生成模型,引入隐藏变量;并在求解模型参数时考虑到隐变量的存在,推导了求解模型的EM算法。模型在知识库上进行对比测试,相比于其他的实体对生成模型能获得更优的准确率与召回率。再以知识抽取和知识更新算法为基础,论文设计了电力知识平台的系统架构规划,分析其系统特点,对知识管理平台进行主体功能设计,并对系统非功能性参数,包括可靠性、安全性、可拓展性参数等进行了配置。最后,对智能电力知识平台进行了效益评估评估,从社会效益和供电公司效益入手,着重分析平台建设在提高电力营销服务质量、优化员工培训质量和促进知识众创模式深化落实这三方面的效益。