面向关系数据库的数据起源研究与设计

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:zj770929
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据起源描述的是数据的来源数据(起源数据)以及从来源数据到目标结果的产生过程(起源转换)。利用数据起源技术,可以计算数据的可信度、追溯数据的错误来源、调试数据、理解数据之间的关系等,在数据分析领域具有重要价值。在关系型数据库中,很多数据起源的研究对全特性SQL和过程语言的支持不佳,而且忽略对起源转换规范化研究。针对这些局限,本文提出一种数据起源的表示模型,从多个层面解释全特性SQL和过程语言中的数据起源,并以PostgreSQL为原型数据库进行实现。本文的内容包括几个方面:(1)以属于拷贝贡献语义的Where-Provenance作为本文的起源数据的语义,提出一种起源转换的表示方法Pet(Provenance Explains Transformation)以描述查询中的拷贝转换过程,同时归纳地说明Pet是如何支持全特性SQL和过程语言。(2)在Where-Provenance和Pet的基础下,提出了一种有向图(模式起源图)描述关系表在模式上的起源关系,同时使用模式起源图中的子图路径(起源路径)描述元组的起源转换过程。作为衍生,提出了字段起源图和字段起源图的子图路径分别描述字段的起源关系和值的起源转换过程。(3)扩展PostgreSQL,实现起源信息的提取计算、查询、可视化的功能。具体地,修改数据库的执行器和PL/PgSQL的调用机制,提取模式起源图和每个输出元组的起源路径并返回给查询客户端,客户端对起源图、起源路径进行可视化应用,根据场景需求,客户端从模式起源图、元组起源路径中分离出字段起源图和值的起源路径。值得提出的是,提取过程不会给查询引擎带来较明显的计算负担。
其他文献
目的对宫腔镜诊治妇产科不孕不育症的临床疗效进行分析。方法资料选自本院妇产科于2012年4月至2013年12月收治的不孕不育患者62例,随机分为两组,对照组31例患者采用常规进行
在宪法权利水平效力理论谱系中,有直接水平效力与间接水平效力之分,宪法权利的间接水平效力是宪法权利发生水平效力的常态。根据宪法权利对私主体之间法律关系影响的强弱程度,宪
文章介绍了南阳黄牛皮革的艺术资源,提出了研究南阳黄牛皮革艺术开发的可行性方法,通过从南阳黄牛皮革的研究条件、研究方法、开发项目和艺术价值方面进行分析,以此推动南阳经济
“十二五”开局之年.珲春市粮食工作将以加快经济发展方式转变为主线,以“稳市场、保安全、强产业、惠民生”为目标.抓好粮食收购、市场调控、储备管理、市场监管、体制改革、产
目的观察静脉输注人血丙种球蛋白联合地塞米松治疗小儿特发性血小板减少性紫癜(ITP)的临床疗效。方法将80例小儿特发性血小板减少性紫癜(ITP)患者随机分为观察组和对照组各40
在污水处理工艺中,SO4·-能够提供与·OH相当的氧化还原电位,但比·OH有更长的半衰期,能够适应更广的pH范围。基于上述优势,基于硫酸根自由基的高级氧化技术(SR-AOPs)在有机
“经”从本义上讲是编织竹简的丝线,《说文解字》将“经”训为“织”,段玉裁注为“纵线”,以此引申为穿订书册的线,进而指书籍,春秋战国时期泛指官府重要典籍和各学派的重要
本文通过调查大学生英语学习动机因素与自主学习能力的相关性,探讨了如何通过转变学生的态度、观念、行为等使学生逐渐养成自主学习的习惯。最后,笔者提出了一些建议:1)激发学生
期刊
北美页岩气水平井普遍采用大钻压、大排量、高泵压而钻井速度显著提高,对比可知我国川南地区长宁区块钻井参数偏低,制约钻井提速。以工区参数强化试验井A井的水平段为研究对