【摘 要】
:
抽取数据的不确定性使得为why-not问题提供数据溯源解释变得越来越有必要.尽管已经提出了一些模型来得到why-not问题的最小化解释,但是当数据量很大时,这些模型的解释效率就
【机 构】
:
东北大学信息科学与工程学院 沈阳 110819
论文部分内容阅读
抽取数据的不确定性使得为why-not问题提供数据溯源解释变得越来越有必要.尽管已经提出了一些模型来得到why-not问题的最小化解释,但是当数据量很大时,这些模型的解释效率就会变得很低.为了提高解释why-not问题的效率,提出了一种新的解释方法.该方法首先根据查询语句和why-not问题构建各查询关系的查询模板.接着依据查询模板将各关系表中的元组修改为能够映射到其查询模板的候选连接元组,同时,记录每个候选连接元组修改的属性分量的个数,并根据连接属性分量对这些候选连接元组建立映射结构.然后,对这些候选连接元组作等值连接得到why-not问题的数据溯源解释.最后,在这些解释中找出修改属性分量个数最少的解释作为why-not问题的最小化解释.为了减少解释的空间代价和时间代价,又提出了一个改进算法,该算法能够避免保留大量不可能产生最小化解释的候选连接元组,提高了最小化解释的效率.实验表明,该算法可以快速有效地为why-not问题返回最小化解释.
其他文献
IC 卡公用电话作为一个新兴的电信业务,起点高,发展快,为保证黑龙江省IC 卡公话的健康快速发展,必须加强管理,保证数据的准确性,搞好省内话费结算,建立正常秩序。
IC card public telep
文章充分考虑现实社会中各类可能因素,以风险规避为导向,寻求供应链网络均衡决策.运用两阶段随机规划方法,将风险条件值(CVaR)进行风险评估,将闭环供应链中正向环节的第一类
饮酒时,通常女性比男性较易醉酒,这是为什么呢? 科学家对一批妇女和男子做了试验:在早饭给他们各喝两杯低度酒,结果表明,进入女性血液中的酒精量比男子的多约1/3。最近,《新
在传统关系数据库上进行关键字查询已成为近来数据库领域的研究热点.然而,当数据源发生变化时,查询结果也有相应的变化,重新执行查询代价高.把查询结果更新转化为物化视图维
老年人、体弱多病者或处于恢复期的病人,都习惯用老母鸡炖汤喝,认为鸡汤的营养比鸡肉高。其实,鸡汤所含的营养比鸡肉要少得多。据研究,高胆固醇、高血压、肾脏功能较差者,胃
随着语义网上RDF数据的爆炸性增长,人们迫切需要可以高效存储和查询RDF数据的SPARQL执行引擎;与此同时,传统关系数据库经过数十年的研究发展,各项技术趋于完善,可以为SPARQL
自从2020年初,由于突发情况的影响,我国经济、教育、文化、卫生等各个方面都受到重大影响.教育的发展受到严重阻碍,讨论我国教育如何发展,其中职业教育,高职扩招200万备受关
公路现浇混凝土表面常会出现蜂窝、麻面、起砂、水纹、裂缝、跑模、施工接缝明显、拆模损伤、色泽不均等外观缺陷,在结构外形尺寸和混凝土内在质量满足设计和使用要求的前提
蔚然的烟瘾,是在不知不觉中染上的。最初只是好玩,一帮姐妹去迪厅玩时,各叼了一支烟,蔚然也不好太另类,便也偶尔跟着吸着玩。开始有了烟瘾,是在
Cigarette smoking is uncon
随着大数据时代的到来,数据正呈现量大、类型繁多、价值密度低等特征,因此快速且有效地发现异构数据中有价值的信息将极具挑战,其中,构建支持多种类型数据的索引是主要的研究