论文部分内容阅读
随着互联网技术的不断发展,Web服务技术逐渐成为当前的一大研究热点。在Web服务技术众多研究中,Web服务的可信性已成为国际上致力于要解决的重要课题。对于部署在分布、开放、多变、难控的网络环境下的Web服务,保证其能够正确、安全和有效的为用户提供服务显得尤为重要。因此,进行高可信的Web服务研究具有一定的战略性、基础性和前瞻性,对我国软件业发展具有重大意义。随着Web服务技术的不断发展,各种各样的应用也随之出现。因此,服务质量(Quality of Service, QoS)逐渐成为Web服务中的一个关键技术点,而通过对QoS的评价可判断Web服务的可信性。在目前的研究中,基于QoS的可信Web服务评价多集中在可信度量、QoS管理等方面。虽取得了一定的成果,但在某些问题上仍然缺乏深入的研究。基于Web服务的研究趋势和对Web服务进行可信评价问题的研究现状,本文从以下几个角度对基于QoS的可信Web服务问题进行了深入的研究,取得了以下研究成果:1)针对当前分布式QoS代理难于有效支持QoS的范围查询等问题,提出一种基于QoS的分布式Web服务索引框架。该框架由两层结构的分布式系统构成,其中第一层运用Chord网络对具有相同或类似功能的Web服务进行分类管理,第二层主要用于管理领域相关的Web服务的QoS。为构建用于分布式管理的QoS多维空间,将分类管理的QoS进行归一化,并引入了基于KD-Tree的多维数据管理方式。KD-Tree实现了QoS的范围查询,通过范围查询的方式,可筛选掉大量不满足非功能需求的Web服务。为保证分布式系统的查询效率,提出了基于QoS-Tree的管理方式。QoS-Tree是通过占优关系而构建的,其不仅实现了KD-Tree中涉及到的范围查询功能,而且通过QoS-Tree中占优关系可以较容易的找到满足用户需求的QoS。另外,为避免分布式QoS-Tree中查询负载不均衡,一种负载均衡机制被引入到系统中。实验表明所提出的两种分布式树型结构均能有效支持QoS的范围查询,且QoS-Tree的查询效率要优寸KD-Tree。2)针对开放环境对Web服务中某些QoS指标造成的影响,提出了基于区间型QoS和概率区间型QoS的度量方式以及相应的服务选择算法。区间型QoS的度量方式是通过比较QoS区间上的概率密度来获取QoS中某些指标受动态环境影响的程度。这种方式正确性虽高,但其比较方式只适合于单个或少量的服务选择。概率区间型QoS的度量方式主要是通过计算QoS概率密度区间的置信上、下界与其均值的偏差来描述动态环境对Web服务的影响,因此,最优组合服务的选择可采用均值的加权和最大以及偏差最小来度量。将该度量方式转化为单目标组合优化问题,提出了一种基于社团划分的改进遗传算法。算法通过社团划分方式维护种群的多样性,并通过优良模式的叠加以提高种群收敛速度。仿真实验表明两种度量方法均能有效克服动态环境对服务选择的影响,且基于区间型QoS的度量方式在正确率方面要比基于概率区间型QoS略高。但概率密度的度量方式更适合于采用遗传算法进行全局寻优。实验表明,改进遗传算法提高了服务选择的效率。3)为提高Web服务选择过程中服务之间的合作可信,提出了一种Web服务合作声誉模型。为描述这种合作信誉,构建了Web服务合作网(Web Service Collaboration Network, WSCN)。在合作网中,邻居更新机制能淘汰虚假服务,保证候选服务的可信性。根据合作网结构,任何Web服务都包含两种关系,调用关系和合作关系。因此,Web服务合作声誉可通过这两种关系进行度量。该声誉模型包括两类指标,调用声誉是通过在WSCN的社区结构中选择适当推荐者而计算得到;被调用声誉指标是通过Web服务之间的调用频率来评价。基于WSCN,提出一种Web可信服务选择算法。实验表明WSCN保证了服务选择的可信性,声誉模型能有效的组织Web服务之间最可信的服务进行组合,同时合作关系能有效地加速服务选择的过程。4)为解决海量Web服务带来的服务信息维护开销,提出一种基于云计算的Web服务管理平台。该平台分为四层,最底层由Hadoop分布式文件系统构成,用于支撑整个云环境。HBase支撑Web服务信息注册层,主要用于管理从Web服务中获取的功能和非功能属性。此外,为进一步提高Web服务选择效率,HBase表中还负责维护了Web服务之间的合作关系以及本体树和QoS-Tree。平台中的核心层使用的是MapReduce技术,该层主要是为满足Web服务信息的有效存储,提出了基于MapReduce的QoS数据提取、转换、加载操作和数据挖掘算法。在复杂的Web服务选择方面,通过MapReduce并行搜索所有可能的路径,并获取其中的最优解决方案。实验结果表明所提出的框架更适合海量Web服务的管理。