基于迭代的高性能StAX解析器的设计与实现

来源 :中国科学院软件研究所 | 被引量 : 4次 | 上传用户：luoch668

【摘要】

：

目前,XML(Extensible Markup Language)文档已被广泛用于电子商务、B2B通信、企业信息交换/集成、信息发布等应用领域。低效的XML解析会导致过度的内存消耗和过长的处理时间,

【作者】

：

张国栋

【机构】

：

中国科学院软件研究所

【出处】

：

中国科学院软件研究所

【发表日期】

：

2005年01期

【关键词】

：

XML StAX 解析器语法分析软件测试性能优化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前,XML(Extensible Markup Language)文档已被广泛用于电子商务、B2B通信、企业信息交换/集成、信息发布等应用领域。低效的XML解析会导致过度的内存消耗和过长的处理时间,成为低资源消耗和高性能应用的瓶颈。 StAX(Streaming API for XML)是为了加强用户对XML解析过程的控制而提出的处理XML文档的API。它允许用户以pull模式从XML流中解析事件,也允许将事件写入到XML文档中。与已有的处理XML文档的SAX、DOM相比,StAX具有其他解析方式所不具有的灵活性。本文重点研究了高性能的StAX解析器的设计与实现。我们在详细分析了XML语法产生式的基础上,进行了下推自动机的设计,给出了StAXParser的设计,并介绍了StAXParser各个组成模块的设计和实现,实现了对XML文档的良构性解析。随之,我们以软件工程相关理论为指导,对StAXParser进行了全面的XML兼容性测试。为此,我们设计了测试框架,并利用测试工具进行了自动化测试,保证了测试的高效率和高质量。同时,我们进行了API兼容性测试,使其成为了完善的基于事件的流式解析器。最后,我们以XML Test为测试基准,进行了严格细致的性能测试工作,利用Boland Optimizeit和JProfiler等测试工具和自写代码进行了性能监测与跟踪,寻找性能瓶颈,并采用算法级和语言级的各项优化策略持续进行性能改进,使得StAXParser达到了比较好的性能指标。

其他文献

科学数据库元数据注册系统研究与实现

　本文的目标是研究并实现科学数据库元数据注册系统。研究工作分为三个阶段进行：首先，综合分析比较了元数据互操作技术，从科学数据库元数据互操作问题的出现背景引出了国际上

学位

元数据标准元数据注册系统科学数据库

多Agent系统中信念修正及其应用的研究

人工智能研究者认为智能Agent必须能够采取某种理性方式维持其心智状态的一致性，进而认识到信念修正理论是Agent各种智能行为的逻辑基础。随着对多Agent系统研究的进展，多Agent

学位

信念修正迭代信念修正多Agent系统证据理论历史依赖性博弈论可信度粗糙集

社区宽带综合业务网三层交换机软件的设计与实现

本文涉及一种社区宽带综合业务网络系统,使用交换式以太网技术,在一个物理网络上实现常规电话网、数字电视网、计算机网的基本业务,为社区用户提供IP电话、数字电视、Interne

学位

三网融合三层交换机设备驱动程序用户进程服务质量

垂直搜索引擎中主题网络蜘蛛爬行技术的研究

随着Internet的飞速发展,Web的信息量越来越大,通用搜索引擎在信息采集、存储等方面面临更大的挑战。此外,由于通用搜索引擎面向所有的用户,力争在返回结果上做到面面俱到,而

学位

垂直搜索引擎主题网络蜘蛛爬行技术主题中心向量法页面主题判别算法

LDAP性能安全研究及其在PID中的应用

　　LDAP的不断发展完善及其在分布式环境中的广泛应用促进了目录服务的发展，然而在网络中总是有一些不安全的因素存在，对于那些对安全性要求较高的应用而言，提供安全可靠的目录

学位

网络管理网络安全目录服务身份认证

视频会议系统的设计与实现

本文在分析和总结当前主要视频会议技术的基础上，论述了基于IP的集中式视频会议系统的设计与实现。全文共分七章:第一章简要说明视频会议的现状、发展趋势，以及关键技术；第二

学位

视频会议系统系统设计会议控制子系统会议管理子系统会议终端

自主构件模型及其实现技术研究

Internet的出现使计算机软件所面临的运行环境开始从静态封闭逐步走向动态开放。为了适应这样一种发展趋势，软件系统开始呈现出一种柔性、多目标、连续反应式的新的系统形态，我

学位

自主构件模型网构软件ACEra工具语义表达

USB VoIP网关的设计与实现

　　VoIP电话网关是VoIP电话系统的重要组成部分，它提供了IP网络与PSTN网络的接口，将IP技术与传统的电话网络相融合，实现IP数据包与PSTN语音数据包的实时交换。本文进行了实

学位

电话交换网电话网关网关软件DTMF解码DAA应用

基于图模型与组合特征的推荐方法研究

现代基于网络的商业行为规模巨大,由于产品或者实体的数量繁多,用户不可能一一去阅览,从而有可能遗漏掉很多对用户有价值的商品。推荐系统是信息过滤领域的一个子集,目的是预

学位

推荐系统图数据模型组合特征协同过滤排序学习

基于XACML的授权模型的研究与实现

　　本文的研究目标是解决项目门户系统上的用户身份认证以及资源访问控制方案的设计和实施问题。研究工作分两个方面进行：首先分析和比较了各种用户身份认证技术，从国家科技基

学位

用户身份认证门户系统授权模型资源访问控制XACML规范

基于迭代的高性能StAX解析器的设计与实现

其他学术论文