不完全信息环境下关于XML文档多值依赖及推理规则的研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:sunqingshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实生活中,计算机系统和数据库系统所存储的数据有N^N种形式。对于开发者来说,最耗时间的就是在遍布网络的系统之间交换数据。把数据转换为XML格式存储将大大减少交换数据时的复杂性,并且还可以使得这些数据能被不同的程序读取。XML正在成为一种Internet上的主要的数据表示和交换标准。虽然XML文档很容易表达来自不同源的数据,但是所能表示的语义信息却相对有限。本课题的主要工作是在XML Schema规范的基础上进一步增强定义完整性约束和文档的语义表达能力。采取循序渐进的理论研究方法:首先,通过分析DTD标准和Schema标准的不同之处,并参考关系数据库的完整性以及基于DTD标准的XML文档完整性的相关研究,对基于Schema标准的XML文档的基本数据依赖进行理论研究。为适应XML文档特有的树型结构和半结构化特征,文章采用基于路径的表示方法。其次,参考含有空值的关系数据库的理论,将不完全信息的概念引入到XML文档。创新成果如下:1.给出XML函数依赖的定义及推理规则,并证明其正确性和完备性。提出右部路径单一化、左部路径集闭包和规范覆盖的算法。2.对参与闭包运算的元素类型定义XML键,给出XML键的推理规则,并证明其正确性。提出应用XML键将绝对的XML函数依赖/键和相对的XML函数依赖/键进行转化的算法。3.给出XML多值依赖的形式化定义及推理规则,并证明其正确性和完备性。提出根据模式求多值依赖集、判定最大范围路径、检验多值依赖集是否冗余和规范覆盖的算法。研究相对的XML键和相对的XML多值依赖之间的转换关系,提出解决两种典型XML文档冗余问题的规范化方法。4.将不完全信息引入XML文档,给出严格的多值依赖和松弛的多值依赖的定义,并分别在语义约束的条件下研究其推理规则和覆盖集问题。这里所给出的函数依赖、键和多值依赖,不但可以表示在整个文档中成立的绝对约束,还可以表示在文档的局部成立的相对约束。本课题的现实意义在于:数据依赖从值的角度描述元素类型、属性类型所代表的实体间的关系;提供研究文档规范化、查询优化、结构约束和路径约束等问题的基础;与DTD标准相比,Schema标准能够提供更丰富的数据类型、更强的数据结构定义能力,基于Schema标准的XML文档更适合与数据库之间进行数据传输、转换;将不完全信息引入XML文档,提高它的语义表达能力。
其他文献
M矩阵是一类具有非正非对角元和非负对角元的矩阵,逆M矩阵是一类逆为M矩阵的非负矩阵。逆M矩阵在许多领域中都具有广泛的应用。本文利用图论理论研究逆M矩阵的完备问题,根据
OFDM技术以其有效对抗多径衰落、频谱利用率较高的优点,成为未来宽带无线通信系统的关键技术。OFDM系统中的自适应调制技术,通过为各个子信道选择合适的调制方式和信号功率,能够
随着信息时代的到来,科学实验、企业运作等诸多领域正不断地产生越来越多的数据,如何经济地存储、高效地处理这些海量数据已成为一个数据库应用中迫切需要解决的问题,具有重大的
网格计算是一种利用互联网,把广泛分布的各种计算资源互联在一起的新型技术。传统因特网实现了计算机硬件的连通,万维网实现了网页的连通,而网格则试图实现互联网上所有资源的全
移动自组网是一种有特殊用途的对等式网络,具有无中心、自组织、可快速展开及可移动等特点。匿名安全问题在移动自组网中受到越来越多的关注,目前已成为研究热点之一,本文主要分
近年来,随着图结构在生物信息网络和社交网络等领域的广泛应用以及各种外界因素对数据获取的干扰,不确定图模型越来越受到研究者的关注。同时,子图的相似性查询作为图上的基
近年来,随着网络数据流量不断增大,与数据挖掘相结合的入侵检测系统成为了研究热点。如何将数据挖掘算法有效地结合到入侵检测系统中,是入侵检测研究要解决的问题之一。目前
随着互联网的快速普及与发展,垃圾邮件的泛滥已成为一大难题,它不仅损害了电子邮件用户的合法权益,威胁着互联网信息安全,而且每年给国民经济造成数十亿元的巨大损失。因此研究有
当前地理信息系统(GIS)无论在理论研究上还是在开发应用上都处于一个飞速发展的阶段,被广泛地应用于土地利用、资源管理、环境监测、交通运输、城市规划、经济建设等各个方面
具有真实感的语音同步可视语音合成是人机交互领域一个重要的研究方向,将具有语音动画的人头用在教学、广播、电子商务等领域,可提高人机交互的友好性和真实感,其研究成果在许多