论文部分内容阅读
随着面向服务计算(Service-Oriented Computing,SOC)的爆炸性增长以及Web服务技术的广泛使用,越来越多的服务汇集于云平台,大大促进了Web服务数量的增长,如何在服务存储库中有效地管理服务成了一个亟待解决的重要问题。在大规模服务存储结构中,多级索引模型是非常高效的存储结构,可以减少服务发现和服务组合的执行时间,具有高效稳定、易管理、易维护、低冗余的优势。“键”是多级索引结构中的一个创新性的概念。在多级索引模型的添加操作中引入键,不仅能有效移除冗余,而且能提高操作效率。先前研究中的选键方法并不是最优的,并且没有讨论键值选择方法在何种程度上影响检索效率,是否会影响检索稳定性和添加效率,引发了对更加优化且高效的键值选择方法的探究。同时,先前研究建立在服务调用概率平均分布的基础上,实际服务调用是不等概率的,越热门的服务可能被用户调用的频率越高,而一些服务几乎不被调用。这就需要进一步完善不等概率下的多级索引模型,并研究基于不等概率分布的选键策略。本文主要研究内容概括如下:(1)针对先前研究中选键策略不恰当这个问题,本文根据多级索引模型的选键过程推导出键值与检索时间之间的协变关系公式。结合理论分析,证明多级索引模型中不同的键值选择方法只会影响检索操作稳定性和添加操作效率,而不会影响检索效率。接着根据公式制定选键策略,提出三种键值选择方法。通过模拟实验测试性能,结果显示等概率下改进的键值选择方法,在维持原检索操作效率的基础上节约了添加操作时间,大大降低了检索操作的不稳定性(通过标准偏差测量)。本文实验结果证明所提出的键值选择方法能够有效的提高服务发现和服务组合的效率。(2)针对先前研究基于服务等概率分布及调用,与实际不符这个问题,本文在已有模型的基础上设计和实现不等概率下的多级服务索引模型,服务不等概率有两种情况,包括服务输入参数不等概率分布和检索请求的不等概率调用。在等概率下生成服务输入参数基础上,通过随机选择重复序列模拟服务输入参数不等概率分布,通过蒙特卡洛方法产生正态分布的随机数模拟服务检索请求不等概率调用。然后将不等概率下键值选择问题归约为数学问题,分析讨论检索时间y与每个键类调用次数x_i及调用概率p_i之间的关系,推导出了检索操作的时间复杂度函数,利用函数极值,设计了不等概率条件下整体最优键值选择方法。通过实验构建不等概率下的多级索引结构,对原始键值选择方法、改进的键值选择方法和整体最优键值选择方法进行效率测试。结果显示不等概率下的整体最优选键方法提高了检索效率,实验结果证明不等概率条件下,整体最优键值选择方法的高效性、正确性。