XML模式匹配算法的研究

被引量 : 0次 | 上传用户:edcujmtgb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML逐渐成为了网络中数据表示、数据分析和数据交换的标准。但由于XML数据描述的灵活性,以及XML文档数量和规模的日益增大,如何高效的管理大规模XML数据以及集成大量的XML数据资源变得十分重要。因此用于识别XML模式之间的一致性元素的自动XML模式匹配技术成为许多领域亟待解决的问题。本文在分析研究现有模式匹配方法的基础上,结合XML模式中元素的信息特征,综合考虑匹配质量和匹配效率,提出了一种新的XML模式匹配算法。它主要包括模式的预处理和匹配算法两个部分。首先,模式经过简化处理表示为一种序列结构CPS(Consolidated Prüfer Sequence)。然后用综合语言匹配和结构匹配的混合匹配算法对模式进行匹配。语言匹配充分利用模式元素的特征信息,包括名称匹配、数据类型匹配和基数约束匹配,其中名称匹配采用决策树的原理合并多种字符串匹配算法。结构匹配算法中,首先用孩子元素、叶子元素、祖先元素和兄弟元素的信息计算所有复杂元素对的结构相似值,得到匹配的复杂元素对。然后仅把结构匹配算法应用到匹配复杂元素对下的原子元素,而不是计算所有原子元素的结构相似值,这种结构匹配方法易于发现复杂匹配。最后为了进一步改善效率本文设计了几种并行策略,提出了并行语言匹配算法和并行非复杂节点的结构匹配算法。通过大量实验,验证了本文的模式匹配算法具有高效性,并行改进的算法也具有可行性。
其他文献
酸浆(Physalis alkekengi L. var. franchetii (Mast.) Makino),属茄科,主要生长在黑龙江、吉林、河北、新疆、山东等地。酸浆全草皆可入药,民间常用于治疗急、慢性气管炎和
该研究首先对罗布麻的生长分布、用途及历史,纤维的特点及其纺织品的优异性能,纤维的制取方法及发展现状等情况进行了概述。按照GB/T5889—1986《苎麻化学成分定量分析方法》,对
经济周期是指经济活动中的循环往复周期性的繁荣和萧条,经济周期超越经济体制和经济发展阶段,它普遍存在于世界范围内所有的经济现象中。经济周期的研究至今已有200多年的历
随着计算机网络的普及和应用,人事管理部门作为员工个人档案信息的集合中心也需要面对全新的信息网络化环境。传统的人事档案管理采取人工信息录入的方式,工作效率低且容易出
柿子中含有丰富的营养物质,具有独特的风味和良好的保健作用。柿果具有独特的贮藏加工特性,提高其贮藏保鲜加工品质,是促进我国柿资源开发利用的重要一环。本文以鲜柿果为原
在初中物理教学中,教师要构建更能让学生参与到课堂讨论中的模式,鼓励学生与教师或者同学之间产生良好互动,在轻松、愉快的学习氛围中培养学生的自主探究能力。文章从巧妙设
从渠道权力理论、关系营销理论以及战略匹配的视角出发,研究营销渠道中供应商使用非强制性和强制性两种影响战略在治理分销商机会主义方面的有效性,探讨分销商算计性和情感性
沿河县积极探索以人为核心的城镇化发展路子,通过三级联动压实棚改责任、三方共治优化棚改环境、三管齐下化解棚改矛盾、三重并举增加棚改实效的“四个三”举措有效破解了棚
在财政部新发布的企业会计准则第3号中,增加了投资性房地产内容,这是适应会计外部环境的重要变化。投资性房地产作为一个全新资产构成要素,是企业和税务共同面临的新问题。如
内毒素血症是多种感染性疾病的基本病理,有效地控制内毒素血症的发生发展对于降低多种感染性疾病的死亡率具有重要意义。中医古方大承气汤临床用于治疗多种感染性疾病所致的