【摘 要】
:
随着社会不断进步以及计算机领域的不断发展,数据量已经呈现出了爆炸性增长的态势。为了从海量的数据中快速且准确的获取用户需要的关键信息,迫切需要高效且成本低的查询处理
论文部分内容阅读
随着社会不断进步以及计算机领域的不断发展,数据量已经呈现出了爆炸性增长的态势。为了从海量的数据中快速且准确的获取用户需要的关键信息,迫切需要高效且成本低的查询处理方法。然而由于原始数据不准确,处理缺失值,满足特殊的需求,粗粒度数据集合以及保护用户隐私等各种原因,不确定数据大量存在各个应用领域中,目前不确定数据的研究处理已经成为研究热点之一。虽然对于传统确定数据的查询处理已经趋近成熟,但传统的算法并不适用于不确定数据,如今大数据环境下数据多以并行数据流的形式出现,在面对不确定数据流时,传统的Top-k查询算法无法很好的解决不确定数据流。目前研究人员虽然已经得到了许多成果,但是现有的算法在面对不确定数据流时都有一定的局限性。由于不确定数据流的流速快、数据量庞大等特性以及数据特有的概率问题,处理起来并不能像确定数据一样只返回排序分值最优的前一部分数据,还需要考虑到数据结构,数据之间的关系以及概率等问题,因此处理不确定数据流仍然十分的复杂。针对以上问题,本文所做出的主要工作如下:1.针对当前数据量过大,计算消耗太大等不足,本文提出了一种面向不确定数据的Top-k支配查询算法,该算法中采用了几种有效的剪枝方法以及支配关系以缩减计算量。算法首先对不确定数据使用可能世界模型进行建模,根据可能世界实例得出Top-k概率的计算方式,随后通过用户已给出的排序分值范围、概率阈值与Top-k概率的相关比较以及支配关系的定义,从而对数据剪枝,以减少后续的工作,提高查询效率。2.针对并行不确定数据流的查询处理,提出了一种改进的并行不确定数据流下的Top-k支配算法。在原有的基础上,对算法增加了聚类,结构生成,支配关系以及阈值和数据之间的关系等操作步骤。在传输过程中,算法利用记录表记下某一时间存在于全局候选结果集中数据的状态,以及最小变化时间的方法来减少对数据的支配得分的计算频率,减少了计算机的重复工作量。在分析了该算法的特点后,实验结果表明,与已有的工作相比,该算法可以节省大量的计算时间,在大多数情况下都能提供高精度的查询结果。3.设计并实现了一个原型系统,用以对本文所需提出的面向不确定数据流的Top-k查询算法的可行性验证。首先对原型系统的系统架构和模块设计进行阐述,然后对系统执行流程和各个模块的功能进行了具体分析,主要包括了数据预处理模块、数据剪枝模块、数据传输计算模块以及最后的结果计算输出模块。本文所设计的原型系统能够很好地应用提出的Top-k查询算法,并且具有良好的可操作性。
其他文献
在我国社会主义市场经济体制逐步完善的背景下,教育机构为了能够与社会经济发展相适应,其体制和管理方式也在不断的变革,而把市场营销的概念引入到教育行业和学校的管理中就
道路上车辆和行人的实时检测是计算机视觉的一个重要方向,单阶段的目标检测算法具备较高的实时性,但精度不高。因此本文基于实时性最高的YOLO(You Look Only Once)算法系列中
随着氧化铝的需求不断增多以及其生产技术的越发成熟,氧化铝的产出量随之成倍增多,而作为生产氧化铝过程中产生的固体废料赤泥,对环境造成的污染已经十分严重,大量堆存污染土壤,尘土飞扬污染空气,下渗污染水源等,使得赤泥的利用及处理迫在眉睫。本文针对赤泥的利用,采用铝厂赤泥及电厂排出的粉煤灰两大固体废料外加骨料、石灰、石膏、水泥等物料进行了免烧砖的制备,并探究了免烧砖的最优工艺及性能。本文主要从下以几个方面
基于影像的三维重建是摄影测量和计算机视觉领域重要挑战之一,目标是从通过相机获得影像中获取有用的几何及语义信息。基于影像的三维重建,需要准确计算相机的内外方位等元素
近年来,由薄膜和外部张拉框架构成的大型空间薄膜结构广泛应用于各类航天器中。由于张拉力不均匀和加工工艺缺陷等因素的影响,薄膜结构在实际工作中很容易发生失稳,从而形成褶皱。褶皱的产生会降低薄膜结构的工作性能,并对结构的动态特性有重要影响。目前,针对薄膜结构在外部载荷作用下的褶皱特征和机理已经开展了大量的理论和实验研究。然而,针对含褶皱薄膜结构动态特性的研究很少,特别是对弹性波在含褶皱薄膜结构中的传播特
采用水槽试验的方法,研究在弯道进口前设置坝宽不同、距弯道距离不同以及双丁坝类型不同(非淹没式、阶梯式)的情况下,丁坝附近及弯道水流特性的变化。由于双丁坝对弯道水流特性影响较复杂,因此增加了无丁坝和单丁坝对照实验组。通过流速测量系统和自动水位测量系统对丁坝附近及弯道内水流的流速、水位进行了测量,并利用测量结果对水流流速分布、紊动强度变化、坝后回流区长度及沿程水位、横比降变化等规律进行了研究,试验结果
近年来,随着计算机交互技术(VR,AR)的飞速发展,传统Web在以检索和导航为背景下所提供的二维平面上的交互范式已经不能满足当前用户的交互需求。越来越多的Web应用旨在展示更
入户盗窃在社会生活中是非常普遍的犯罪行为。我国《刑法修正案(八)》将入户盗窃作为盗窃罪的特殊行为类型予以单独规制,将其从普通的盗窃中分离出来,其立法旨意就在于更好的
非晶合金由于其优异的力学、物理、化学性能而在众多领域得到广泛应用,但是其在塑性变形过程中容易产生剪切带,进而扩展造成灾难性的破坏,为此严重制约着大块非晶合金的发展。现有研究表明,非晶合金中形成的剪切带厚度在1020纳米左右,比传统金属材料中的剪切带厚度(10500微米)小得多。剪切带厚度的巨大差异表明,非晶合金中剪切带的形成机制很难用传统金属材料中的热软化机制来解释,而可能与非晶合金独特的原子结构
机床是机械制造业最基础的设备,满足高速精密加工要求的主轴可以说是机床的最重要组成部分,它的性能直接影响着机床加工零件的精度、质量和效率。气动主轴是一种由压力气体驱动,并且由气体支撑,带动主轴高速旋转的新型结构形式,具有高速,清洁、磨损小等优点,被广泛应用在小型零件的加工。本文主要对主轴部件进行了静动态特性研究以及优化,具体内容如下:(1)用计算流体力学fluent软件对气动主轴重要结构空气静压轴承