基于语义元数据的分布式存储技术研究及应用

来源 :贵州大学 | 被引量 : 0次 | 上传用户:wanglei880917
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据存储以及快速准确获取自己想要的信息变得越来越困难。语义网和Hadoop分布式平台的出现能有效解决数据存储及获取数据的困境,但伴随而来的便是大规模语义元数据的出现,这也使得数据的管理面临巨大的挑战,所以构建一个实用的语义元数据分布式存储系统对推进大数据的分析与应用变得愈来愈重要。论文首先介绍了语义网与RDF语义元数据存储技术的研究背景及研究现状,讨论了课题研究的重要性及意义,并在此基础上阐述了语义元数据、资源描述框架RDF、Hadoop及HBase等相关技术;其次,分析了RDF语义数据存储存在的问题,并提出一种基于HBase的RDF语义元数据存储策略,该存储策略主要是针对HBase中Rowkey字段的数据存放提出一种优化方法,即充分综合数据加载、数据去重存储以及数据查询响应等因素,将RDF数据的谓语进行散列计算后,将该值与谓语存放于Rowkey中;第三,论文在优化后的RDF数据存储策略基础上提出了数据加载、数据去重及数据查询算法。其中,数据加载算法主要是利用HBase自带的数据加载工具完成,数据去重算法是利用模糊C均值聚类算法实现模糊聚类,并通过扫描谓语表来进行优化,进而获取初始聚类中心值,而数据查询方法是通过将RDF数据的三个分量分别抽象化,借鉴基本图模式查询方法,通过判断查询条件找到相关节点及边,在为节点进行打分的基础上对节点进行排序,找出最佳的前k个值为最终结果输出;最后,论文利用当前最常用的语义网数据测试集LUBM在小型集群中进行测试,通过对各评价指标的实验结果分析,证明了论文提出的存储策略及算法是可行的。
其他文献
目的:探讨胰腺占位性病变性质诊断中超声造影的应用及临床价值。方法:选取2017年4月-2018年12月本院收治的疑似胰腺占位性病变患者55例作为研究对象。分析胰腺实质、良性、恶
点云是目前摄影测量、遥感、计算机视觉等多个领域广泛应用的数据源之一,而信息提取是点云处理、分析和应用的必经环节。为此,学术界已经提出了大量点云信息提取方法。本文从
地名承载着人与环境的关系,蕴含社会的记忆,是拥有地域文脉的无形地标,成为居民意象中不可或缺的元素。在人类文化的演进历程中,不同时期产生的地名,呈现出一种区域历史演进序列的
报纸
<正>农产品电商是将"互联网+农业"结合起来作为重要商贸突破口,开启农户销售新路径,提高农民的销售收入,同时还能扩宽消费者的消费选择,满足消费需求。2018年中央一号文件《
近些年来,随着教育改革的迅速发展,我国教育逐渐把重心转移到学生素养的培养与发展上,因此,优质高效课堂教学这一旨在培养学生核心素养的教学模式越来越受到师生的青睐.本文
以有机蒙脱土、相容剂为改性材料,采用熔融插层法制备了有机蒙脱土/聚碳酸酯(PC)/丙烯腈-苯乙烯-丁二烯共聚物(ABS)复合材料,研究了增容剂用量、有机蒙脱土用量对复合材料力学性能的
-肩膀僵了。-按一按!-眼睛酸了。-按一按!没有什么疲惫是按摩仪解决不了的,如果有,就上两部!评测编辑罗皓田梦谭韵芝工作后,没有什么疲惫是一部按摩仪不能解决的。如果有,就
目的:探讨逆行或次全切除胆囊对于复杂胆囊腹腔镜切除的临床价值。方法:选择35例复杂胆囊患者使用腹腔镜下逆行和(或)次全切除胆囊,并与35例中转开腹的患者比较手术时间、术中出血
专业技术人员知识更新补缺是科学技术与工业迅速发展的要求 ,是社会进步的需要 ,是企业发展的要求。为加强专业技术人员知识的更新和补缺 ,应加强宏观指导 ,并制定强有力的促