RDF图数据管理的关键技术研究

被引量 : 0次 | 上传用户:benben8383
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义Web使跨应用、企业和团体的数据共享与重用成为可能,而RDF是语义Web的基础,其数据模型是RDF图。与已有数据模型不同,RDF图是有向超图,能够表达隐含语义,富含文本信息,且规模庞大。这些特点造成RDF图数据管理中存在存储设计难度大,查询处理复杂且效率低,查询结果排序困难等问题。针对以上问题,本文对RDF图数据管理中的若干关键技术展开研究。首先,本文研究了隐含数据查询过程中的自反传递闭包计算问题,提出了一种基于有向图素数编码标记机制的方法:PLSD。PLSD将任意有向图上结点间可达关系(属性的自反传递性)计算转化为标记中整数的整除关系计算。与传统基于forward chaining和backward chaining的推理相比,PLSD能够更有效地实现RDF图中自反传递闭包的计算。实验表明PLSD优于同类其它标记机制。其次,针对RDF图的有向超图特点,本文提出了一种原生的RDF图存储方法:PI。该方法能够有效避免由数据模型不一致而导致的数据模型转换开销。它还具有降低存储空间开销,易于实现各种图论算法,聚簇存储RDF图有向边等特点。PI存储上结合PLSD等推理策略的语义查询系统,在LUBM测试基准实验中综合性能指标要高于对比系统。对于RDF图中的文本信息,本文提出以资源文档为索引和查询基本单位的细粒度关键词查询方法。克服了以RDF文档为单位的粗粒度关键词查询方法难与语义查询结合的问题,提高了语义查询和关键词查询的综合查全率和查准率。最后,在查询结果排序方面,提出在本体层次上对概念与关系重要性的排序方法CARRank。基于CARRank实现了实例数据层资源全局重要性排序和结合查询结果相似度与资源全局重要性的综合排序。CARRank算法利用本体中概念和关系相互增强的迭代方式计算概念重要性和关系权重,避免了对资源统计信息的依赖。并给出了其收敛性的理论证明和实验检验。实验验证了基于CARRank算法的概念重要性排序与关系权重的合理性。原型系统在中文新闻等领域的成功应用验证了本文工作的价值和意义。
其他文献
当前农村幼儿教育存在统筹规划不合理、投入严重不足、民办园发展管理不够、教师队伍不适应和幼儿教育小学化倾向普遍的问题。在分析问题产生原因的基础上,提出相应对策:提高
在便秘的辨证施治过程中合理利用现代专科检查手段 ,中西医治疗有机结合 ,可以提高中医药治疗便秘研究的现代科技含量 ,有效发挥中医药的优势 ,形成与时俱进的中医药便秘诊治
随着现代社会事务逐渐复杂化、多样化,良好的行政决策单纯依靠政府作为唯一的权力中心,已无法胜任治理的重任。这需要政府与社会的共同治理和共同管理,并最大限度地调动公民
随着大量农村计划生育夫妇已经或即将开始进入老年期,"老有所养"将成为他们日益强烈的直接现实需求,与非计划生育夫妇相比,他们面临更多的养老风险。本文在问卷调查基础上,对
在知识经济时代,知识是企业生产运营中的重要要素,知识型员工逐步成为了企业价值创造中最重要的驱动力量。然而由于知识型员工具有高度自主性、高创造性以及强烈的自我实现需
采用在首诊运用耳针相应穴区、体针阿是穴治疗四肢关节痛症无效之后给予腹针治疗的方法 ,以观察和分析腹针治疗该临床常见病症的疗效及其特点。观察结果显示 :经治 1 76例中
通过对北京市部分农村失地妇女的现状、创业意向与动机、培训情况、创业存在的困难、社会期望等方面的调研,了解当前农村失地妇女现状,探索农村失地妇女创业中存在的问题,提
<正> 晚唐诗河中一颗光辉耀眼,明媚闪烁的星星,为诗歌艺苑献上了一束色彩斑斓的异葩的诗人,当首推李商隐。这位苦难社会的艺术天才,一生造诣颇深,创作甚丰,其诗具有较强的艺
本文参照项目管理理论体系,结合工作实践,对当前变电检修项目的检修模式、人力资源管理、三大目标管理和安全管理等几个方面逐一加以分析研究,指出对于变电设备应该改变传统
<正> 毛泽东的早期教育思想是指毛泽东同志在革命前和革命初期(本世纪10—30年代)的教育思想。在这个时期里,毛泽东亲自参与了许多方面的教育实践,积累了丰富的教育经验,逐渐