基于K-中心点聚类的Skyline计算及应用

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:clys1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社会特别是互联网的发展,造成应用数据量急剧增大,致使数据库查询技术得以快速发展和广泛应用。由于Skyline查询在多目标决策等应用上比较具有优势而被引入到数据库领域,并且已成为数据库查询领域的一个研究热点。然而,目前的Skyline查询多是针对单个用户情景下设计的,仅局限于返回单一的结果集,或者在分别由不同维度组成的多个子空间下进行的Skyline查询,并返回多个结果集。随着技术应用的发展以及新需求的出现,实际应用中需要考虑到不同用户的不同需求。他们可能感兴趣的是全局数据中不同局部的数据,这些数据具有局部内相似且局部间相异之特征。在分析现有的Skyline查询算法解决该问题不足的基础上,提出了一种基于K-中心点聚类的Skyline查询算法。该算法能够应用于诸多重要领域,比如推荐系统、传感器网络、数据分析等等。比如能够处理:用户在购买商品时,对同类不同层次的多个商品优化选择问题;无线传感网中,满足不同条件的传感器节点的多目标优化问题。本文研究的内容主要集中在如下方面:(1)在介绍了传统Skyline查询的相关算法时,分析了不同算法的优缺点,以及它们的运算效率。(2)针对现有算法并未顾及数据间相似性问题,提出了基于K-中心点聚类的Skyline查询算法。把相似的数据聚类成一个簇,相异的数据分别聚类到不同的簇,使得簇内数据相似,簇间数据相异。(3)简要介绍和分析了维数灾难问题,并按照数据不同维度之间的相关性,对数据的维度进行正相关降维。因此又在基于K-中心点聚类的Skyline查询算法的基础上进行了改良,提出了基于降维的K-中心点聚类Skyline查询算法。本文实验部分共分两部分:第一部分设计了六组实验,通过将基于K-中心点聚类得到的Skyline点平均数与BNL(块嵌套算法)求解得到的Skyline点的平均数进行对比实验。实验结果显示,基于K-中心点聚类得到的Skyline点平均数要比BNL算法求解得到的Skyline点平均数要有更多的选择性。第二部分设计了一个实验,通过比较发现,改进的基于K-中心点聚类的Skyline算法在时间消耗上明显优于未改进之前的Skyline算法。同时,通过具体案例对提出的算法进行了验证性演示。
其他文献
今年,盐湖区农机局立足一个“早”字,早计划、早准备、早安排、早部署、早动员,通过实施“五抓”工程,积极谋划“三夏”农机化工作,力争实现农机作业的机械数量、作业范围、作业面
目的:评价准分子激光上皮瓣下角膜磨镶术(LASEK)治疗近视的疗效观察.方法:应用日本产NIDEK EC-5000型准分子激光机对78眼不同程度近视(-1.50-12.00D)行LASEK治疗,术后3~12个月
图像拼接旨在快速生成高清无缝的全景图像,该图像具有更大的视野,且不会出现失真或伪影。它是一个综合了多个学科知识的研究热点,在计算机视觉、测绘、计算机图形学等方向都具有重要的研究意义和实用价值。然而,在大视差场景下,现有的图像拼接方法往往伴随着错位、重影等问题。针对上述难题,本文提出了一种新颖有效的图像拼接方法。该方法将图像拼接分成三个阶段:图像配准,最佳缝合线搜索和图像融合,并针对性地开展了如下工
【正】 身为商界要员,你一定曾为自己的仪容颇费心思:妆彩与时装的选择既力求世众不凡又不能太前卫惹眼,这样的尺度简言之即高雅又时尚。1999年初春之际,正是你更新梳妆台与
在加压连续微反色谱装置上,用正己烷(n-C6)和甲基环戊烷(MCP)作进料,在不同预硫化量(0.05,0.1、0.2,0.4、0.6(重%)的工业Pt-Re-Ti/γ-Al2O3催化剂上进行芳构化反应。结果表明,硫明
【正】 Anna Leung(梁艳娴) Anna的设计清婉超脱,又饱含了世纪末的复杂情绪:结束抑或是开始,分离抑或是相聚,失落抑或是拥有,垂死抑或是新生,冷却抑或是炽热,生存抑或是淘汰
为满足人类更深层次的智能通信需求,6G将实现从真实世界到虚拟世界的延拓。为此提出了6G需要解决“人-机-物-灵”的问题,设计了6G演进的双世界架构,该架构将支持6G中存在于虚
【正】有识之士指出: 特许经营有时机已降临中国,寻找最在的发空间并调整战略,便能成为赢利能手。谁也不能否认,中国乃是世界上最大的特许经营市场之一。从市场容量来讲,中国