同构对称发布/订阅系统中ToP-k算法的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:cyqhexxjl86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术发展,同构对称发布/订阅系统的应用也越来越普及。由于在同构对称发布/订阅系统中,产生的候选环匹配结果集很大,特别是在大型的系统中,可能是海量的,不利于用户对候选结果的选择利用。如何快速、高效的为用户推荐k个最优的候选环匹配是同构对称发布/订阅系统中研究的关键问题之一。在同构对称发布/订阅系统的不同应用中,有时匹配结果可以调用打分函数为其打分,依据分值排序求出前k个最优的。有时无法调用打分函数打分,不能对其排序。为此本文分别提出了面向匹配结果不可排序的Top-k查询算法和面向匹配结果可以排序的Top-k查询算法。  针对匹配结果不能通过调用打分函数打分的问题,本文对相关的基础理论工作分析与总结,寻求解决问题的相关技术。提出了基于k-支配Skyline查询的面向匹配结果不可排序的Top-k查询算法。首先扩展了同构对称发布/订阅模型;然后对算法基本思想以及基本操作做了详细的描述;最后,本文在模拟环境中对算法做了多种评估分析比较试验,从订阅数量、维度、数据分布、选择度等方面分析实验结果,实验表明本文提出的算法查全率和查准率都在94%以上。  匹配结果可以通过调用打分函数打分时,打分函数复杂度不同算法性能可能也不一样。本文针对高复杂度的打分函数,提出了基于高复杂度打分函数的面向匹配结果可以排序的Top-k查询算法。该算法策略是基于在计算机中一次比较运算时间效率优于一次算术运算。所以本算法核心就是减少了调用打分函数的次数,打分函数复杂度较高时,候选匹配各维上比较一次的操作总运算时间代价优于调用一次打分函数的时间代价。本文最后从订阅数量、打分函数复杂度、选择度、维度等方面对算法性能做了评价。基于高复杂度打分函数的面向匹配结果可以排序的Top-k查询算法的在打分函数复杂度越高,时间性能优势越明显。
其他文献
利用信息手段对不断产生的高通量生物数据进行分析处理是当前生物数据处理的趋势。人类基因组计划成功完成,使得生物信息学的研究进入了后基因组时代,蛋白质组学研究受到深入关
计算机系统的应用领域和复杂程度正在日益发展.其中的一个分支嵌入式系统更是抓住了当前数字电视等信息家电市场急速膨胀的机遇,得到了空前的发展.嵌入式系统的繁荣又带动了
随着Internet的发展,网格计算技术己成为当前网络并行计算的一个新的研究热点.网格系统由大量的异构资源组成,它具有复杂、动态、高性价比和局部自治等特点.由于网格系统中各
数据仓库存储大量历史数据,OLAP应用涉及到对大面积历史数据的复杂查询,查询优化是提高OLAP响应速度的关键。目前最有效的方法是增加综合数据的存储,但存储空间的有限限制了综合
MIS的快速成型技术是一项近几年才兴起的管理信息系统构建技术,它是将面向对象的程序设计(OOD)、合约关系理论、参照概念模型设计(RCDM)、物理模型设计(PDM)、脚本的工具生成
在软件项目的开发中,利用已有的遗产软件系统服务于新的业务需求,已经成为软件工程的一个发展方向.基于此,对现有遗产软件进行维护、重用以及逆向工程的需求促进了对程序理解
木文首先概要介绍了ATM技术的主要内容,然后介绍了ATM技术与IP技术融合产生的一些技术类型,进而提出了目前典型的用户组网需求,最后通过对ATM VP通路中的VC通道连接的详细研究,使
关系数据库中的数据冗余会导致重复存贮、插入异常、修改异常和删除异常等问题.数据库的冗余分物理层面的冗余和逻辑层面的冗余两大类.逻辑层面的冗余主要包括冗余表、冗余记
论文对当前C/S和B/S体系结构下的一些问题进行了分析,研究了采用数据库访问中间件及多服务器模型解决面临的传输安全、流量控制及负载平衡等问题的设计方案。论文主要研究了数
随着IP网络的大规模建设和发展以及现代数字信号处理技术和语音压缩编码技术的进步,VoIP(Voice over IP)技术正在经历从良好到一流、从可以接受到高度的可靠语音质量的转变过