多知识库融合的属性抽取方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lxm8154
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的普及和社会信息化程度的提高,各个应用领域所积累的信息资源在网络上飞速增长,网络服务已逐渐成为了人类获取知识的必要渠道,百科知识库正是其中最为广泛应用的知识服务平台。现如今依据不同方法构建的知识库不断涌现,其中基于互联网多用户协作的维基百科和百度百科是最具代表性的语义知识库。但是不同语义知识库之间存在相互独立性,而且不同知识库的知识分类体系不同,从而造成不同语义知识库对相同知识的描述不一致;与此同时,由于不同知识库对知识描述的偏重点不同,使单一知识库存在信息片面的问题。  针对语义知识库词条信息不一致问题,本文提出了“类别-词条-属性”融合框架,并对框架的类别、词条、属性对象进行形式化定义;通过知识融合的方法构建以词条为主要描述对象的多源知识库系统。本文将维基百科与百度百科进行融合处理,通过语义相似度计算的方法对不同知识源的冲突语义信息进行处理,很大程度上解决了两个知识库的知识信息不一致问题。  针对语义知识库词条属性不全面问题,本文提出了属性传播的属性抽取原理,并建立属性传播模型,同时提出了基于属性传播的属性抽取算法提取知识库的词条属性,从而来完善知识库词条的描述信息。基于词条属性抽取的结果提取知识库的类别属性,为了完善类别属性对类别的描述,提出了基于 K-means的属性关联词抽取算法,并且通过语义相似度计算消除K-means聚类出现的关联偏移问题。  实验结果表明,本文提出的基于属性传播的词条属性抽取的算法具有较高的准确率,有效地完善了词条属性信息;以及基于 K-means聚类的类别属性关联词抽取算法有效地完善了知识库的类别信息描述。
其他文献
随着科技的进步,人类社会进入了信息化。信息管理系统及其强大的功能已得到人们和社会的重视。开发一个图书馆信息系统主要包括两个方面的工作:使用数据库技术以及开发应用系
随着虚拟现实技术的发展,针对虚拟人技术的研究逐渐增多。本文通过分析虚拟人的关键技术,重点研究了感知模型和路径规划的方法。在分析探讨已有感知模型和路径规划算法的基础
随着计算机网络和多媒体技术的迅速发展和日益普及,人们对多媒体信息的需求也越来大。作为多媒体信息重要成员之一的数字化音乐,也越来越频繁地影响着人们的日常生活。音乐检
移动智能终端的迅速普及吸引了众多的应用开发者开发丰富的应用来为人们提供便捷的服务。近段时间,随着移动设备性能提升和以HTML5为代表的移动Web技术的发展,一种新的基于HT
互联网的发展促进了家庭网关的发展,家庭网关的广泛应用丰富了家庭娱乐生活。随着网络业务的增多,诸如音频、视频及定制多媒体等业务越来越多地应用,家庭网关的网络性能也直
随着第四方物流产业的快速发展,我国第四方物流应急越来越受到物流服务商和社会各界的重视。现有的第四方物流应急预案大多以文本的形式存在,信息形式化程度低,关联性差,管理
目前,以支持多领域协同CAx/DFx技术为特征的复杂产品的虚拟样机技术正成为制造业界产品研究、开发的热点。如何将分布、异构环境中的多领域工具集成起来进行有效的设计仿真工
目标跟踪一直是计算机视觉研究领域的热点问题,其应用领域有视频监控、人机用户接口、虚拟现实等等。视觉跟踪要求在光照变化、遮挡等各种因素的干扰下,能准确有效地跟踪不同
随着数值预报技术的发展,天气预报质量有了很大提高,但目前的数值预报技术已趋于成熟,仅仅依靠数值预报本身无法再使预报水平获得较大程度的提高。多模式天气集成预报是因此
随着工业信息化进程的不断加快,软件行业发展与企业信息化战略关系日益紧密,企业对软件系统的功能性要求越来越丰富,而在成本预算上却希望尽量的降低。SaaS(Software-as-a-Se