【摘 要】
:
虽然可扩展标记语言(eXtensible Markup Language, XML)诞生的时间并不长,但它作为数据描述和信息交换的标准,已经得到广泛应用。目前,Internet、企业和政府部门的管理系统、
论文部分内容阅读
虽然可扩展标记语言(eXtensible Markup Language, XML)诞生的时间并不长,但它作为数据描述和信息交换的标准,已经得到广泛应用。目前,Internet、企业和政府部门的管理系统、个人计算机中都采用某种形式的XML来存储数据和交换信息,因此对XML数据的查询和过滤显得日益重要。XML文档过滤系统一般采用XPath表达式来表示用户的个性化信息,而有限自动机[23]可以完美的对XPath进行建模,因此,当前的XML文档过滤系统一般都是基于XPath和有限自动机的。传统的XML文档过滤系统需要扫描和解析XML文档中的每一个元素,增加了过滤代价,影响了过滤效率。本文首先提出了一种称为流索引的XML索引机制,直接跳过那些无用元素及其子元素,从而快速定位到有效的元素位置。该机制在最大程度上减少了处理元素的数量,提高了处理效率。实验结果表明,流索引具有线性的时间复杂度,能够提高XML过滤的处理效率。上述技术是对XML文档进行处理,而对XPath表达式中含谓词和嵌套路径的情况也是XML过滤系统的重点研究问题。针对这种情况,本文提出一种新的自动机建模思想。它将XPath表达式的每个节点都建模成自动机状态间的转换触发条件,并且该思想只用一个自动机即可,不用为每个分支结构都定义一个自动机或过滤器。本文还对含AND的情况进行了模型优化,并给出了该思想在XML文档过滤系统中的应用。实验结果表明,对谓词和嵌套路径的处理,新模型优于传统模型。
其他文献
基于生物体信息处理机制模型以及算法研究已成为人工智能领域的一个新的热点,它体现了现代科学研究中关于多学科、多领域间的交叉融合、互相促进以及相互渗透的特点。生物体
验证码技术是当今计算机安全领域与人机交互领域的前沿课题之一,在互联网领域有着广泛的应用。日常使用的验证码大部分是基于视觉图片验证码方式,给残疾人中的视力障碍者造成
随着众多企业开始应用项目管理的方式管理企业中的各项活动,作为管理科学的一个分支,项目管理已经成为企业中不可或缺的一项内容。在具体的项目管理中,如何使资源在不同任务
工作流管理是实现企业过程集成、提高企业运行效率和柔性的一种支撑技术,是计算机科学、管理科学、自动化科学等多学科领域关注与研究的热点问题之一。它根据一系列规则,文档
XML(Extensible Markup Language)是被W3C基于标准的广义标记语言所创建,被用作定义语义标记。在Web服务、电子商务、数字图书馆等诸多网络相关应用领域已经成为描述数据的事
网格中的资源管理和任务调度很复杂,传统的资源管理和任务调度方法已经不能适应网格环境。将经济学模型引入到网格体系中,把经济学的方法应用于网格资源管理和任务调度,是近
无线传感器网络中的节点以自组织多跳的方式运作,作为底层硬件,传感器节点在信号的感知、收集、传输过程中均存在能量消耗。由于传感器节点能量有限,必须采取高效的节能技术提高
无线传感器在国民经济、科学研究等领域已经应用地越来越广泛,同时它所面临的安全威胁也越来越大,但是目前针对无线传感器网络的安全防范研究相对较少。
本文将重点考虑无
Internet发展到至今已经完全渗入到人们生活工作的各个方面。作为半结构化语言XML已经成为一种最重要的数据载体,在Web服务、电子商务、数字图书馆等诸多网络等领域的数据描
图像社区是随着web2.0和多媒体技术的发展与普及而产生的一类社交平台,作为一种新兴的网络应用,每天都有成千上万的用户将他们的本地图像上传至网络并添加标签、相应的描述等与