XML内容路由关键技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:doni123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息高速公路的发展,互联网上出现了大量采用事件-驱动模式的应用,如主动服务中的发布订阅系统、基于内容的XML路由、XML文档分发以及新闻传递等。这类应用中,信息以XML流的形式由一系列生产者经过事件代理传递到另一些消费者手中;消费者通过过滤引擎进行订阅。由于仅与XML的内容本身有关,而与信息在何处发布无关,这种路由方式常被称作内容路由。然而,现有的内容路由技术在高效匹配算法、对异构事件处理等方面尚存一些问题。扩展标记语言XML作为一种数据表示和交换的标准,具有自描述性、可扩展性、利于异构数据交换等诸多优点。本文以XML为事件模型、XPath作为多用户订阅模型来研究内容路由的若干关键技术。本文提出了一种基于hedge文法的HXFA机来处理XML发布流事件,并给出了HXFA机的过滤优化算法及算法正确性分析。最后,将多个HXFA机合并作为系统的过滤引擎。从算法的效率和可扩展性方面进行实验分析,提出的方法优于著名的内容过滤引擎YFilter。分析了现有XML相似性模型的优缺点,针对这些模型的不足,扩展了向量空间模型,提出了基于语义和支持度的层次路径模型,并给出其生成算法及复杂度分析。模型首先挖掘文档集中频繁出现的路径,通过文档中的语义信息来合并重复节点、路径,同时对文档特征向量进行维数规约。最后给出基于语义和支持度的距离测度方法。该方法兼顾了XML文档的结构信息和语义信息两个方面的相似性。与树编辑距离模型相比,不但每个文档具有“类原型”描述,而且在时间开销上有较大优势。根据H path模型,提出一种基于改进粒子群优化的XML文档聚类方法。首先将文档集映射到粒子群模型问题空间,然后利用粒子群聚类方法进行聚类,最终权衡了时间和准确性两方面因素,进一步提出混合的粒子群聚类方法,增强了聚类收敛程度和准确程度。尽管提出的模型在提取时已进行了数据归约,然而对于冗余的、异构的XML文档而言,高维灾难问题仍然存在。针对此问题,提出一种独立分量分析的预分类方法。该方法首先对文档矩阵进行维数归约,随后在独立分量张成的空间中进行聚类分析。采用本方法有两个优点:第一,去除相关冗余,挖掘更具有区分能力的特性并尽量刻画潜在的数据分布,从而增加聚类准确性。第二,通过有效降低向量空间的维数,大大压缩了搜索空间规模,减小开销。最后,提出了一个支持异构事件处理的XML发布/订阅系统体系结构。该系统反应了本研究中提出的内容路由技术是如何应用的。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
本文分析了煤化学课程"中国煤炭分类"部分教学中主次指标、数值范围、亚分类编码和分类图示等方面的问题,提出几点解决方法。精炼并适当调整中国煤炭分类国标内容,应用于煤化
立足国情,充分借鉴国内外食品安全指数研究的最新成果,综合考量,首次将"食品行业诚信指数"纳入构建食品安全指数范畴,提出如何构建全国统一权威的食品安全指数,如何给相关评
批判性思维在小学教育阶段越来越受到关注,不少国内外学者认为应该从少儿时期开始培养学生的批判性思维。批判性思维的培养是提升学生思维能力和品质的关键。在小学英语阅读
给出矩阵多元多项式的带余除法 ,从而用微分代数的观点 ,得到把一类微分方程 (组 )化为无穷维Hamilton系统的充要条件及其具体无穷维Hamilton系统形式· 再把此方法和吴方法
目的探讨疝环充填式无张力修补术治疗腹股沟疝的经验并评价其临床价值。方法回顾总结2000年1月至2007年6月疝环充填式无张力修补术治疗腹股沟疝262例临床资料,其中伴随高血压
油菜机械化生产目前是国家发展油料作物生产机械化的研究重点,而油菜机械化种植环节是油菜全程机械化生产中的首要研究对象,通过近几年对油菜机械化直播技术的研究,总结出我国南
流程工业作为一个国家的主导行业,对国民经济的发展起着举足轻重的作用。利用企业综合自动化改造传统产业,可极大挖掘企业的内部潜力,产生巨大的经济和社会效益。 过程系统通