基于关联数据语义相似度计算研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:heinblue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语义网技术的不断成熟,网络资源环境向智能化、语义化和结构化方向发展。当前的网络资源环境中的信息多数是以人能够理解的形式呈现的,缺乏被计算机理解和处理的基本形式,阻碍了网络资源环境的智能化、语义化和结构化发展。语义网的提出可以很好的解决这些问题,通过给万维网上的文档添加形式化语义信息,使计算机可以理解和处理这些文档,实现数据的自动化处理,提高信息检索的效率。关联数据的提出使语义网有了实质性的发展,而且已被W3C推荐为语义网的最佳实践。通过将分散领域中的数据通过结构化描述以及数据之间的链接关联起来,形成全球巨大数据空间,即数据网络。这种数据网络资源环境为信息的最大限度共享、重用以及发行提供了保障,也为人们的知识发现活动提供了新的机遇。随着数据网络中的关联数据量的不断增加,如何利用关联数据特点进行知识发现成为当前研究需要解决的关键问题。本文主要针对关联数据知识发现研究中的语义相似度计算进行研究。通过对现有RDF数据的语义相似度计算方法的研究,分析其优缺点,提出了多因素关联数据语义相似度计算方法。该方法重点分析了影响相似度计算的3个重要因素,属性取值类型、属性权值和关联关系,并针对每个影响因素给出了相应的相似度计算公式,最后通过具体的实例对该方法进行了验证。实验结果表明,该方法充分利用了概念之间的语义信息,能更准确表示出概念之间的语义相似关系。在不同的应用中,属性的重要性是不同的,属性权值也会发生一定的变化,本文针对属性权值计算问题进行了进一步的研究,提出了动态权值关联数据语义相似度计算方法。该方法在Tversky模型的基础上改进了Song D提出的属性权值语义相似度计算方法,根据待匹配的数据集中属性不同取值的数量、属性值的分布以及属性的有效性对属性的权重进行计算,有效地区分了Tversky模型以及Song D提出的方法无法区分的实例对,提高了关联数据语义相似度计算的精度。为了验证该计算方法的有效性和稳定性,本文利用ACM和FOAF测试数据集对该计算方法进行实验。实验结果表明,与现有的关联数据语义相似度计算方法相比,动态权值的关联数据语义相似度计算方法的精度和稳定性都优于其他相似度计算方法。
其他文献
近年来,随着科技的发展,手持设备都配有蓝牙和WiFi直连通信模块,通过使用蓝牙和WiFi直连技术,手持设备可以无需通过因特网即可互相连接进而传输数据,这种连接方式可以减少因特网的
随着Internet在各个领域的应用越来越普及,应用种类及数量的迅速增长,人们急切需要一种可以在Internet上实现服务或应用的跨平台、独立及松耦合化的中介技术。此时,Web服务技术
随着各种先进技术在智能电网中的广泛应用,以及IEC61970标准为智能电网信息一体化建设提供了一系列的标准和规范。其化解了供电企业异构系统间信息共享的矛盾,解决了供电企业智能电网信息交互过程中的诸多实际困难,也方便了第三方应用程序并入电网平台。传统基于C/S(客户端/服务器)架构方式GIS(Geographic Information System)应用,在随着电网规模的不断扩大,它所固有的一些不
目前光网络正向全光、业务多样化的方向发展。同时,业务量的攀升、全球能源危机的出现,为通信网中能源的有效利用提出了挑战。全光网络中没有电再生设备,不能规避非理想设备和器
多核/众核网络化计算、低能耗绿色计算、高可信计算等计算模式的出现,对嵌入式实时系统带来了新的研究需求与挑战。随着嵌入式系统应用领域的不断深化和芯片集成度的日益提高
近年来,国内移动互联网强势发展,智能手机迅速普及,人类已经进入了移动互联网时代,利用移动终端接入互联网进行信息交互,演变成为信息时代的一种新的生活方式。2014年中国互联网络
近年来,嵌入式计算、无线通信网络和分布式信息处理等技术快速发展,各种新技术得到广泛应用;而现实的应用需求也为人们不断设计出新的技术规范提供了动力。ZigBee作为无线通信
几何造型是CAD系统的核心.参数曲线曲面一直以来都是描述几何形状的主要工具,其中,参数化和曲面拼接是CAD中曲线曲面造型的基础问题.作为本文的部分内容,我们研究了Bezier曲
现代通信技术的高速发展以及移动智能终端的普及,使得人们对电信业务质量的要求越来越高,电信运营商可以通过提升业务质量来赢得用户资源,业务的用户体验是制定高效提升业务
视频图像序列中的目标跟踪是计算机视觉领域中的核心研究课题之一,最近几十年来受到了学者们的广泛关注。目标跟踪技术为更高层的视频理解和场景解释提供底层对象和分析依据,