【摘 要】
:
现实数据库中的不完整数据、不一致数据、重复数据等非清洁数据为数据库的有效使用带来了影响,从包含非清洁数据的数据库中得到满足清洁度要求的统计分析结果,为数据库研究带
【机 构】
:
哈尔滨工业大学计算机科学与技术学院
论文部分内容阅读
现实数据库中的不完整数据、不一致数据、重复数据等非清洁数据为数据库的有效使用带来了影响,从包含非清洁数据的数据库中得到满足清洁度要求的统计分析结果,为数据库研究带来了新的挑战,聚集查询是统计分析的基础.面向非清洁数据,提出了有清洁度保证的聚集查询处理算法,用于处理包含group by子句的聚集查询.考虑到在非清洁数据中,同一个元组可能属于不同的分组,提出的方法是利用可重叠聚类的方法将数据库中的元组加以分组,从而得到考虑数据非清洁性的分组,以及基于这些分组计算得到的聚集结果及其以概率表达的清洁度.提出的方法适用于多种聚集函数以及包含选择条件的聚集查询.通过实验验证了方法的效率.
其他文献
采用预涂激光熔覆技术,在A3钢表面制备原位生长Cr3C2-CrB复合增强镍基激光熔覆层。使用金相显微镜、扫描电镜(SEM)、能谱仪(EDS)和X射线衍射(XRD)仪对熔覆层进行了显微组织和
近红外二极管激光吸收光谱诊断技术以其高灵敏,响应快,结构相对简单,造价低廉等优点已成为测量准均匀燃烧场和流动场温度和组分分压的有效手段。本文介绍了所建立的可调谐二
建立了应用导管X光透镜的掠出射微区X射线荧光分析系统,并将该系统应用于纳米薄膜的分析.为了提高入射X射线的强度并提高系统的空间分辨率,选用焦斑为41.7 μm的会聚透镜对原
使用纳米SiO2粉体为原料,在2.0~4.2GPa、150~1200℃范围内进行了一系列的高压高温实验研究,得到了该压力温度范围内晶化产物α-石英与柯石英的p-T相图,而且该相图中的相边界在6
本文利用动网格技术和有限体积法研究了基于动态边界控制的气动优化的方法。该优化方法是通过在求解非定常流动的过程中计算优化的目标函数随设计变量变化的梯度,而利用参数化
苏联剧变20年以来,学术界一直在挖掘其剧变的原因,其中一个原因就是苏联软实力的严重衰落。软实力是苏联兴起的最直接原因。十月革命前,俄国是一个落后的农业国,几乎没有什么
1931年4月,国民会议代表的选举在辽宁备受关注,但事实上张学良已经拟好名单.在东北大学选 区,他授意校当局按其拟好的名单进行选举,引起该校师生的反感,选举结果也与张的期望
日本侵华战争给中国造成了大量的人口伤亡和严重的财产损失,其中尤以南京大屠杀为甚.目前,学术界关于抗战损失的研究歧见不一,且对南京沦陷后的抗战损失研究较少.本文试图利
扎鲁特旗位于内蒙古自治区通辽市的西北部.旗内中北部为大兴安岭余脉,大部分属低山丘陵地带,海拔多在400米以上;南部地处科尔沁沙地的北部边缘,地势开阔,沙坨与湖沼相间.这里
实际中大多数生产调度问题具有多目标优化的性质,本文讨论在不确定加工时间和机器故障的情况下.如何优化多目标流水车间调度问题.首先设计最大流程时间和最大延迟时间两类指