【摘 要】
:
随着互联网技术与数据库技术的发展,信息采集设备与技术的进步,近些年来,互联网数据日益复杂庞大,因此,如何帮助用户从这些海量、庞杂的信息中挖掘出最有价值的信息越来越成
论文部分内容阅读
随着互联网技术与数据库技术的发展,信息采集设备与技术的进步,近些年来,互联网数据日益复杂庞大,因此,如何帮助用户从这些海量、庞杂的信息中挖掘出最有价值的信息越来越成为学术界研究关心的热点。skyline查询可以根据用户的需求,从复杂庞大的互联网数据中迅速挖掘出用户真正关心的数据资源,在许多实际应用中有着十分重要的作用。但目前绝大多数的skyline算法都关注于全序域上的数据查询,适用于偏序域上的算法较少,且计算效率不能很好的适应用户日益增长的需求。因此,高效地处理偏序域上的skyline查询是一个极具现实意义的问题。针对以上问题,本文对偏序域上的skyline查询问题展开研究,提出了有效地提高查询效率的方法,具体地,本文主要贡献如下:(1)提出将倒排索引引入skyline查询领域,倒排索引将每个偏好维度上的属性按从优至劣进行排序,减少大量的冗余计算,从而提高计算效率。(2)提出了 PSP-B算法,解决了传统算法对每次计算都对整个数据集进行扫描的问题。算法对数据集在每个维度上建立倒排索引,通过循环扫描策略快速找到扫描结束点来结束算法,这样达到了对数据集过滤剪枝的目的,提高了计算效率。(3)在PSP_B算法的基础上,提出了 PSP-I算法,在将偏序域映射到全序域之后,建立倒排索引之前,对整个数据集按本文提出的分组策略进行分组,然后在组内建立倒排索引。并提出了整组过滤策略,对于不含skyline结果点的分组可以进行整组过滤,在基础算法的基础上进一步提高了剪枝效率。(4)设计了详细的性能比较实验,通过实验证明了本文提出的PSP_B和PSP_I算法可以有效地处理偏序域上的skyline查询问题,并且PSP I算法在查询效率上要更优于PSP_B算法。(5)最后,设计并实现了基于本文提出算法的原型系统,实现了算法的应用价值,满足了查询用户的应用需求。
其他文献
“这/那+个体量词+名词”结构是现代汉语中出现频率较高的一种结构,对母语为汉语的学习者而言较为简单。可是,笔者在教学实践中发现,该结构对泰国中学生来说是一个比较难的语
人体上可以运动的部分被称为效应器。对于运动来说,我们既可以控制如腰、颈和头等距离身体较近的效应器,也可以控制如手臂、手和腿等距离身体较远的远端效应器。对于脑卒中患
在对外汉语教学研究中,有关泰国零基础中学生汉语教学的研究寥寥无几。起始阶段对于后续教学工作的开展有着深远影响,尤其是新手教师。我们汉语教师志愿者大多数是没有过实际
敦煌高僧故事画主要表现为图绘历史上高僧的神异事迹,也包括为本地高僧绘塑的一些庄严影像等。其发展大概可以划分为三个时期,初唐时期在佛教感通故事大为盛行的背景之下,集
随着交通网络的快速发展,不同类型的道路网交织成一张复杂多样的交通网络,如何在复杂的交通网络上寻找一条能够满足人们多种需求的目标路径是一个重要且又困难的问题。传统网
本文探讨了寰枢关节旋转半脱位的病名、诊断及治疗方法。笔者在总结前人经验的基础上,结合自己的临床实践,初拟寰枢关节旋转半脱位诊断标准。
近年来,泰国的汉语教学事业蓬勃发展,尽管汉语已经成为泰国最受欢迎的外语之一,但是汉字教学的效果仍然不太理想,师生们普遍反映“汉字学习难”。因此有必要探索一条依据汉字
本课题来源于实际生产环境的实际需要。城市供热管道系统无处不在,管线长度通常为公里级别,而管道沿线沿途需要有多个控制井对管道系统进行控制和监测,管道系统的每个控制井
2015年8月出台的《关于深化国有企业改革的意见》指出在改革过程中存在的主要问题是不健全的现代企业制度和混乱的企业管理现状,并且这些矛盾直接导致了国企运行效率低下,国有资产流失等。因此六项任务被提上日程,其中一项为完善现代企业制度,“推进公司股份制改革,健全公司法人治理结构”。这成为法学领域研究的热点问题之一:现代企业制度设计、股权结构、企业内部制度改革、对国有资产的监督管理制度体系建设、法律规范
射频模式识别(RFID)技术广泛应用于仓储管理、物流管理等很多领域。持续扫描是RFID技术的一个重要应用。当RFID标签的分布范围较大时,阅读器不能在一个位置收集所有标签ID。