XML数据流的过滤与查询技术

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:linda456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前XML流查询处理中还存在许多待解决的间题:如XPath查询的优化,流数据的动态验证,复杂XPath的支持,如何连接多个文档的查询而得到最终的结果。如何降低处理器的时空复杂度等。 本文综述了当前国际上对这类问题的研究成果,总结它们存在的不足,指明进一步的研究方向。
其他文献
本文提出一个并行多维视图维护方法PMDVM,它通过选择性算法将增量式视图维护和视图自维护有效地融合在一起,同时,它还利用相关性算法对不相关更新进行过滤,可以有效地降低消息总数和数据的通信量,从而大大提高视图维护的效率,为了赋予系统并行处理所有更新的能力,还利用时间戳和相关更新冗余缓冲机制来解决并发更新问题,并使用透明提交代理机制来纠正可能产生的无序提交问题,从而最大程度上保证了送交到视图维护层的所
本文提出一种基于静态滑动窗口的数据流聚集技术(SSWAT--Stream Summarization using Static Sliding Window-based Approximation Tree)。SSWAT的主要思想是,报据窗口大小和更新周期,建立一个树型结构,其中每个结点存储着这个流数据内不同区段的数据近似值。树的不同层对应着不同的更新周期。其更新周期与窗口的更新周期相联系。SSW
本文描述了DNA序列的压缩问题并简要回顾了相关工作,针对其中用(广义)后缀树寻找DNA序列中的冗余信息这一类方法中存在的问题,在广义后缀树的最长公共子串对应的路径上引入优化策略,找出当前最适于压缩的冗余子串,实验表明,用局部优化策略找出的冗余子串和2阶算术编码对DNA序列进行压缩可以有效地提高压缩效果。
本文提出了一个具有一般性的、可扩展且可定制的数据流模型RealModel,该模型突出刻画了数据流的时间特性,对数据流上的操作语义深入的分析和定义,并把数据流的数据特性和操作特性以约束的形式抽象出来,RealModel以三元组形式化描述了数据流的数据结构、数据操作及约束,此外,RealModel将关系和数据流在数据形式和操作上进行统一。
本文在原有贝叶斯网络分类器的基础上构造判定树,从而将贝叶斯网络分类器中蕴含的分类判定知识更直观地呈现给用户。将此方法应用于银行信用卡资信评估的分类分析,成功地获得了有指导意义的信息。进一步的工作包括研究构造判定树的其它的属性选择标准.更高效的剪枝策略,以及充分利用这种树的判定结果的非确定性提取更多有意义的知识如概率分类规则等的方法。
本文针对滑动窗口聚集查询问题,提出了一种基于滑动窗口语义的聚集计算方法--链树(linked-tree)算法,该算法把滑动窗口逻辑分层,记录层次内数据统计信息,具有很高的执行速度;同时,所需的内存量不与窗口大小直接相关,可以大大节省内存;此外,基于该算法的查询共享策略,可使类似的聚集操作共享相同的链树结构,进一步提高了查询处理速度并节省内存资源。
在空间查询优化中,确定空间操作在查询计划中的顺序位置是核心的间题。针对含有多个空间操作以及非空间操作的混合空间查询,本文提出了混合查询的优化策略。该策略对空间操作的过滤和精练步骤在优化阶段就进行逻辑分离,并分别进行空间过滤和精炼操作代价分析,将启发式规则和动态编程相结合来选择更为合理的空间查询执行计划.这样不仅解决了利用空间索引和降低空间操作计算代价之间的矛盾,还使用了基于代价的分析方法为混合查询
本文给出DTD文档的两种对象化模型,这两种对象化模型的主要创新特点包括:引人逻辑节点来表示元素之间的逻辑关系;把属性作为子元素加人到对象化模型中,使属性不必进行特殊处理;元素或属性的元数据单独建模,与元素节点或属性节点分开,使元素或属性的元数据能够反复使用。
随着企业业务的发展与信息的膨胀,数据仓库的规模不断扩张,数据访问呈现更广的地域分布性,提高数据仓库在Web环境下的数据访问性能是本文所讨论的内容。通过DW-DS结构来构建Web数据仓库,能够更好地发挥数据仓库对企业的信息支持能力.
利用关系数据库来存储和管理RDF数据是一种有效的方法.本文在分析总结了RDF模式和ER模型联系的基础上,提出了一种基于RDF模式的RDF数据存储方法.本文在第3节给出了该方法的具体实现步骤,在第4节通过一个实验具体分析讨论了该方法的可行性和优点.