【摘 要】
:
XML解析的高耗时特点制约着XML应用系统整体性能的提高,并行化是一种重要的优化手段。现有的并行XML解析算法存在的问题是需要通过预处理进行数据划分,才能实现分片并行完全
【机 构】
:
北京工业大学计算机学院,集美大学计算机工程学院,华侨大学计算机学院
【基金项目】
:
福建省自然科学基金项目(2008J04005), 北京市自然科学基金项目(4082003)资助
论文部分内容阅读
XML解析的高耗时特点制约着XML应用系统整体性能的提高,并行化是一种重要的优化手段。现有的并行XML解析算法存在的问题是需要通过预处理进行数据划分,才能实现分片并行完全解析处理。预处理往往很耗时,若进行优化处理,则实现复杂。提出的方法可实现对XML数据任意分片直接进行解析,并行构建各个片断中的子树,再通过子树合并获得全局的文档树。实验结果表明该方法能有效利用多核计算环境,并行实现XML解析。
其他文献
针对网页分类中关联分类方法存在的如下两点不足:(1)仅把网页当成纯文本处理,忽略了网页的标签信息,(2)仅用网页中的特征词作为关联规则的项,没有考虑特征词的权重,或仅以词
针对多边测距法的不足,考虑定位算法所应用的现实环境,在典型DV-Hop算法的基础上,提出了一种改进的三维定位算法。该算法除了将DV-Hop定位算法从二维空间移植到三维空间以外,
网格是一种复杂的分布式计算系统,研究其网格服务对网格作业的调度算法的分布式部署和性能分析问题具有重要的意义。网格服务调度系统的状态空间模型考虑了具有不同的输入速
最大派系问题(Maximal Clique Problem,MCP)是组合优化中经典而重要的问题之一,在信息抽取、信号传输、计算机视觉、社会网络及生物信息学等众多领域有着重要的应用。学者们根
大学邮件系统是学校的一项重要应用。介绍了自助申请个人邮箱、自助申请公共邮箱、自助绑定个人邮箱等模块的流程设计、数据库设计及实现等方面。实际运行结果表明,用户体验
语义网数据的关键词查询是语义网研究的一个重要问题。首先给出语义网数据关键词查询的相关定义。根据研究目标不同,将已有解决方案分为混合型和非混合型的语义网数据关键词