【摘 要】
:
从大型数据库中查找出用户最感兴趣的k个数据来支持用户多标准决策的制定是数据库领域一个重要的研究课题。k遗憾查询使用最大遗憾率的衡量标准,返回k个使得用户的最大遗憾率最小的数据。但是,目前已有的关于k遗憾查询的研究存在效率较低和结果集会偏向于最不满意的用户的问题。论文针对k遗憾查询存在的问题,研究了基于用户开心度的k代表点选取技术,结合目标函数函数的特性,给出了高效的解决方案。主要工作和创新点如下:
论文部分内容阅读
从大型数据库中查找出用户最感兴趣的k个数据来支持用户多标准决策的制定是数据库领域一个重要的研究课题。k遗憾查询使用最大遗憾率的衡量标准,返回k个使得用户的最大遗憾率最小的数据。但是,目前已有的关于k遗憾查询的研究存在效率较低和结果集会偏向于最不满意的用户的问题。论文针对k遗憾查询存在的问题,研究了基于用户开心度的k代表点选取技术,结合目标函数函数的特性,给出了高效的解决方案。主要工作和创新点如下:(1)研究了k代表点代表性的衡量标准。针对现有的k代表点代表性的衡量标准,论文详细地分析了它们的优缺点,并提出通过最小开心度和平均开心度的衡量标准来更好地对返回的k个代表点的质量进行衡量。(2)研究了基于用户最小开心度的k代表点查询处理技术。论文首先提出了最小开心度的衡量标准,并证明了最小开心度函数是单调非减的。基于这一特性,提出了延迟评估的加速策略来减少k遗憾查询所需要的函数评估次数。此外,引入随机采样技术来缩小k遗憾率查询候选集的大小。最后,基于延迟评估的加速策略和随机采样技术,论文提出了两个高效的算法。实验表明通过减少k遗憾查询所需要的函数评估次数,论文提出的算法可以有效提高k遗憾查询的效率。(3)研究了基于用户平均开心度的k代表点查询处理技术。为了解决k遗憾查询会偏向最不满意的用户的问题,论文提出利用平均开心度的标准来更好地衡量用户在只看到k个返回的数据点而不是整个数据库中所有数据点时的满意程度,给出了平均开心度最大化的问题定义并证明了该问题是一个NP-hard问题。此外,论文发现平均开心度函数满足子模的特性,基于该特性并结合延迟评估的加速策略和随机采样技术,论文提出了高效的具有理论保证的近似算法并给出了详细的理论分析。实验表明论文提出的算法在查询效率和结果集的质量方面都优于已有的查询。
其他文献
本文运用社会学的调查研究方法,以国内艺术治疗从业者为研究对象,试图借他们之眼,更清晰的认识我国艺术治疗行业的发展状况。具体研究过程包括了问卷调查与深度访谈,通过对问卷结果的统计描述和对访谈结果的建构主义写作呈现出我国艺术治疗从业者视角下的行业真实而丰富的图景。结论概括如下:1.艺术治疗从业者以各类心理健康工作者的角色,或在学校、医院、企业等组织单位中,或以独立工作室的形式,服务于成年人、特殊群体等
进程演算是刻画并发与交互式反应系统行为的原型规范语言,它们通过进程项来描述反应式系统的规范及实现,实现是否满足规范则由行为等价或者精化关系来刻画。经典的模拟(simulation)关系主要是针对反应式系统间的精化关系的刻画,这类系统只具有被动的行为。对于具有主动行为的系统,经典的模拟关系将不再适用。为此,学术界将模拟和互模拟(bisimulation)概念推广,提出共变-异变模拟(Covarian
微米至百微米级厚度的微液膜在微纳制造、电子封装、丝网印刷等领域有广泛应用,目前离心旋涂是获得微液膜的主要途径。然而,当液膜的表观粘度超过1 Pa·s时,受液体添加物、基
目标跟踪是计算机视觉众多应用中重要的组成部分之一,具有很大的研究价值。目标跟踪的主要任务是在一个视频中,在每一帧都给出目标的具体位置和大小,其中只有目标的第一帧的信息是已知的。尽管目前阶段目标跟踪已经取得了很大的进展,但是由于存在模型快速移动,光照变化,背景模糊等挑战,目标跟踪依旧是一个富有挑战性的研究问题。基于判别式相关滤波相结合的算法自提出以来,由于其兼具了速度以及精度的特点,吸引了大量研究者
随着移动通信技术的快速发展,用户对于网络质量和数据速率的要求越来越高。协作中继技术的出现有效解决了小区边缘弱覆盖的问题,提高了数据传输速率和用户体验感知。能量采集作为近年来出现的一种先进技术,可以从周围环境的可再生资源中收集能量,从而实现绿色通信的目的。因此,协作中继技术与能量采集技术的结合是目前的一个研究热点。本文以具有能量采集功能的中继系统为研究对象,分析多中继系统中的中断概率,提出了不同发送
新一代信息技术是当前新一轮技术变革中的重要构成部分,具有万物互联、智能、绿色低碳等重要特征,也因此成为推动经济增长、产业转型升级的重要力量。新一代信息技术正与制造
大数据时代下,数据呈多维化、海量化的特征,查询趋于个性化,用户对结果的准确度、查询效率要求更高。传统的多维数据查询方法存在不能高效地解决静态和空间属性相结合、动态的多用户查询以及分类域上的个性化查询等问题,因此研究在度量空间中的多用户查询以及分类域上的用户偏好获取对于找出高质量的结果集具有十分重要的意义。多维Skyline查询根据对象数据点的属性值特性主要分成两类:数值域和分类域。本文重点关注空间
目前,随着图像采集技术的发展,图像相关的应用越来越广泛。由于图像中包含的信息量很大,从图像中提取具有区分性的抽象特征是物体识别中的关键步骤。传统的图像特征是手工设计的特征,依赖于设计者的先验知识,其适用范围往往较窄。在人工智能时代,深度学习被广泛用于学习图像的特征表达,基于深度学习的方法能够从大量数据中学习特征表示方法,获得具有强大表现力和泛化能力的特征。本文基于以上研究背景,研究了基于深度哈希的
协同过滤推荐算法是最常用的推荐算法之一,其利用大量相关数据对用户行为相似性进行分析并为用户提供个性化推荐。在大数据时代,大量的数据呈现在人们面前,而个性化推荐的实现需要挖掘数据中的隐含信息。LDA主题模型通常用于获取文档的主题分布信息,因此,许多学者尝试将LDA主题模型应用于协同过滤推荐算法之中,并且不断地进行探索优化。传统的LDA主题模型是无监督主题模型,在实际的文本挖掘应用中,整个数据集经常需