【摘 要】
:
随着互联网技术的快速发展,数据呈现出爆炸式增长方式。海量存储系统元数据访问成为整个系统的性能瓶颈。目前存储系统主要采用树形结构的命名空间或关系型数据库来组织管理
论文部分内容阅读
随着互联网技术的快速发展,数据呈现出爆炸式增长方式。海量存储系统元数据访问成为整个系统的性能瓶颈。目前存储系统主要采用树形结构的命名空间或关系型数据库来组织管理元数据,并通过索引来提高元数据访问效率,这些方法忽略了文件数据之间的关联关系,导致元数据管理功能单一,无法提供更为丰富的个性化服务。通过对分布式文件系统HDFS元数据图谱化的研究,设计并实现了一种基于Graph模型的元数据组织管理方法。该方法首先根据文件数据的特点提取出特定的语义信息,利用这些语义信息构造出语义元数据,然后根据文件数据在语义上的联系将文件元数据和语义元数据组织成元数据图,并通过对HDFS中的元数据服务节点Namenode的改造,设计出一个全新的元数据服务节点Graphnode,由Graphnode通过元数据图对外提供服务,最后在元数据图中使用协同过滤以及聚类分析算法来挖掘分析文件数据之间的关联关系,使Graphnode能够提供更为丰富与智能化的服务。测试结果表明,基于图模型实现的Graphnode能够有效的组织管理元数据以及实体之间的关联关系,在提供传统元数据服务的同时,利用元数据图中丰富的语义信息和节点之间的关联关系,还能在元数据层进行数据的挖掘与分析。相比在传统存储系统中实现的文件推荐以及聚类分析,性能提升了1倍以上。这不仅给存储系统的智能化提供了一种解决思路,而且还让元数据的组织与管理具有了新的意义与利用价值,同时给大数据时代的数据挖掘与分析提供了一种全新的解决方案。
其他文献
为了提高数控插齿机插削斜齿精度,提出了一种基于试切误差补偿的数控加工方法。首先,在分析斜齿螺旋线偏差产生机理的基础上,采用线段逼近理论主运动曲线,计算满足加工精度要
近年来,中国农业银行开封分行认真贯彻落实中央和总分行党委各项决策部署,以“六维方略”为指引,坚持党建统领,持续提升服务实体经济和服务“三农”水平,加大“双基”管理、案防风
本研究考察叙事语篇标题启动条件对不同阅读能力的中国英语学习者即时主题推理加工的影响。研究按照2(阅读技能)×3(标题启动条件)因子设计,采用阅读时间法,以简短的叙事语篇
以山东省某小学400名小学生为被试,采用结构方程模型考察了小学生数学教师支持、数学学业成就与数学焦虑之间的关系。研究结果表明:(1)数学教师支持与数学学业成就呈显著正相关,
在新技术快速发展的背景下,数字技术为出版业的创新发展提供了强大动力,本文结合当前儿童图书发展情况,在论述AR少儿图书的基础上,分析其在推动少儿阅读活动中的优势,并结合
对资产结构进行分析是企业加强资产管理 ,提高经济效益的一项不可忽视的工作。通过分析资产结构的意义、原则及通常考虑的指标 ,说明分析资产结构势在必行。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
读神学前,我在学校里做了几年语文老师和班主任,那时每到课间我就坐在教室里,常常有孩子围着我讲述他们的故事,尤其是七八岁的孩子,诉说的愿望特别强烈。"老师,我掉了一颗牙!
随着我国修建地下工程的数量越来越多,不可避免会遇到在地震区甚至在高烈度地震区修建隧道工程的问题。地震作用下,隧道的破坏程度与埋深有较大的关系,并且深埋隧道和浅埋隧