基于函数依赖模拟建立映射的数据集成机制研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:huaweihbl999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文针对全局模式受完整性约束,并且数据源的内容之间存在大量覆盖的数据集成问题,提出了一种从关系数据到XML数据的集成机制,它具有良好的系统可扩展性,可以解决由于数据源内容的覆盖而潜在的数据冲突.该文的研究主要围绕半结构化的全局模式及其完整性约束的表示,保持完整性约束的从全局模式到数据源模式的映射,能够处理数据源内容覆盖的集成机制三方面展开,取得的创新性成果如下.(1)以完全标识的XML模式树组成的森林表示受完整性约束的全局模式该文定义XML模式树作为数据模型,描述具有半结构化特征的全局模式.首次将结点出现频度引入对XML树相等的判定,提出了递归的XML树相等的定义.这个定义更为符合现实中人们对半结构化实体个体的识别.在此基础上,定义了XML树的关键字.首次全面研究了关键字在XML模式树上的结构特征.通过完全标识的XML模式树中每一个结点与它的关键字结点集形成的函数依赖表达全局模式上的完整性约束.(2)通过函数依赖模拟,计算保持完整性约束的从全局模式到各数据源的映射对于全局模式上有完整性约束的数据集成,需要在全局模式到各个数据源的映射中体现完整性约束,才能进行预期的集成.与以往的方法不同,该文根据码经由等值连接在关系模式之间的传递规律,通过关系模式对XML模式树上函数依赖的模拟,在全局模式到数据源的映射中保持了完整性约束.以往这种映射大都人工设定,该文中的映射可以通过计算半自动地产生,并且全局模式在各个数据源上的映射单独保存.数据源的变动被局限在本地的映射中,不会影响系统其他部分,从而使该文的解决方案具有其他Global-As-View方案所不具备的良好的系统可扩展性.(3)Mediator-Wrapper结构下能够处理数据源内容覆盖的集成机制数据集成系统能够根据所有数据源的内容为针对全局模式的查询赋值.该文提出了一种针对树模型的简单查询语言Query-On-Tree,用以描述针对全局模式的查询.各个Wrapper根据本地的映射自顶向下为查询的赋值模式树赋值,在完整性约束下,将关系数据源产生查询结果非常自然地转换为XML格式,无需像以往的转换方法那样引用外部函数.Mediator对各个Wrapper返回的结果进行组装时,首次处理了数据源之间内容的覆盖问题.采用的基本思想是,根据全局模式上的完整性约束,识别并且合并相等的XML树,对出现频度不同的子树采取不同的措施,以此消解可能的数据冲突并且集成全局模式中的实体分散在各个数据源的出现频度不确定的那部分数据.对于全局模式受完整性约束,各个数据源的内容之间存在覆盖,从关系数据到XML数据的集成问题,该文提出了一种在保持全局模式上完整性约束前提下,建立在由函数依赖模拟计算的全局模式到源模式的映射之上的GAV数据集成机制.以往并无解决同样问题的数据集成方案.与其他的数据集成相比,该文中的集成机制能够处理由于数据源内容之间的覆盖而可能导致的数据冲突,并且具有良好的系统可扩展性.该文的集成机制已经在TSI和Carehaven项目中得到了成功的应用.需要说明的是,该文对数据集成问题设定的条件完全来自于真实的项目.该文的集成机制也适用于没有上述限制条件的数据集成问题.
其他文献
运动目标跟踪是计算机视觉领域非常活跃的一个课题,而且有着非常广泛的应用,例如视频会议、机器人导航、虚拟现实等等。在会议电视系统中,大多数都装有可控制摄像机,对发言人的运
随着卫星导航技术的发展,导航接收机在复杂环境下的应用越来越广。在GNSS接收机中,跟踪环路是数字基带信号处理的核心环节,对接收机的定位精度等性能起着决定性作用。因此,本文开
该论文主要研究了基于OFDM的高速无线Internet中物理层、数据链路层、传输层的若干关键技术,重点是对无线衰落信道中高突发差错引起的分组丢失对TCP/RLP性能的影响进行理论研
以环氧树脂为基体,短切玻璃纤维和玻璃纤维布为增强材料,通过RTM工艺制备了玻璃纤维增强环氧树脂(GF/EP)复合材料,并研究了RTM工艺制备玻璃纤维布增强环氧树脂(L-GF/EP)和短
差分跳频系统以数字信号处理技术为基础,采用差分跳频、异步跳频、宽带接收等多项先进技术,可以在短波波段实现宽频带、高速率的跳频,极大地提高了短波电台的抗跟踪干扰、抗多径
针对传统个人软件程序设计偏重单线程的缺点,通过研究当前流行的几种嵌入式系统,提出了一种简单的针对个人的微型嵌入式系统的结构和部分外围构件设计。系统主要包括任务间的通
现实世界的复杂性使人们需要能够从表面的现象中提取出事物的本来特征,从大量冗余的信息中提取真正有用的信息,从不同种类的对象中提取最能够体现不同类事物之间区别的特征,这就
对于超视距雷达接收天线阵,其阻抗参数的测量问题,具有非常重要的意义.接收天线阵列单元间存在着互耦的影响,影响了雷达测角的精度,尤其对于阵源间距较小及背景较复杂的情况,
随着成像技术的发展,成像空间分辨率得到不断提升,一些人为因素影响下的复杂的多目标、多地类覆盖的场景类型在遥感图像中开始清晰地呈现出来。在这种新的形势下,传统的逐像元/
用人工的方法来模仿甚至获得智能,长久以来这一直是人类最重要的梦想之一。20世纪中叶电子计算机的问世为建立和研究体现“智能”行为和特性的人工系统提供了有力的工具,并直接