论文部分内容阅读
随着 Web2.0时代的到来,Web服务相关技术的快速发展,不同的服务供应商在Internet上为用户提供越来越多功能相同或相似的Web服务,使得用户不得不需要花费大量的时间和精力来寻找满足自己需求的 Web服务,即使用户找到了满足自己功能需求的Web服务,也不能保证其具有较好的服务质量(Quality of Service,QoS)。因此,从大量具有相同或相似功能的候选服务中选择满足用户需求并且QoS较好的服务推荐给用户变得越来越重要。 QoS用来描述和评价Web服务的非功能属性,在基于QoS的Web服务推荐中,预测服务 QoS的缺失值是必要的。目前已经有一些经典的方法通过使用协同过滤技术来进行Web服务推荐,然而他们很少考虑用户和Web服务的位置信息。在实际情况中,用户或Web服务的位置信息对QoS的属性值,例如响应时间,吞吐量,失败率等,有着显著的影响。此外,随着Internet上用户和Web服务的急剧增多,当前的 Web服务推荐算法在这种大规模数据稀疏的情况下存在预测精度和性能不高等问题。本文针对当前在大规模数据稀疏的情况下, Web服务 QoS预测精度不高,算法可扩展性差的难题,提出了两个新颖的基于位置感知的协同过滤算法。本文的创新点主要概括如下: (1)提出了一种基于网络位置正则化的Web服务推荐方法(Collaborative Web Service QoS Prediction With Network Locatrion-Based Regularization, NLBR)。该算法引入了用户的网络位置信息,通过加入用户的网络位置正则项来改进矩阵分解模型为当前活跃用户预测 QoS缺失值,然后将满足用户功能需求的候选服务根据QoS值排序,最后将QoS较优的Web服务推荐给活跃用户。实验结果表明,通过加入用户位置信息改进矩阵分解模型进行 QoS的缺失值预测,不仅在预测精度上优于目前主流的推荐算法,同时,该算法的时间复杂度与数据规模的大小呈线性相关,可以部分解决大规模数据下稀疏性与可扩展性差的问题。 (2)提出了一种基于网络位置的近邻模型和矩阵分解模型相结合的Web服务推荐方法(Collaborative Web Service QoS Prediction Via Network Location-Based Neighborhood Integrated Matrix Factorization, NIMF),该方法引入了用户和Web服务的网络位置。该算法通过将基于网络位置的用户近邻模型和基于网络位置的Web服务近邻模型进行矩阵分解训练学习,然后和矩阵分解模型结合,得到两个模型。最后通过可调节的参数将这两个模型的结果联合起来进行 QoS值预测,然后将候选服务根据QoS值排序,将满足用户需求并且性能较好的Web服务推荐给活跃用户。实验结果表明,本章提出的模型不仅预测的精度优于其它方法,而且时间和空间复杂度与输入数据的规模呈线性关系,很好的解决了大规模数据下的稀疏性问题,同时解决了传统协同过滤算法可扩展性差的问题。 (3)通过使用公开发布真实环境下大规模的QoS数据集进行实验来验证本文提出算法的推荐性能。该数据集通过收集分布在30个国家的339个用户对73个国家的5825个Web服务进行调用信息,得到1,974,675条QoS记录。该数据集是目前已公开发布的真实环境下规模最大的QoS数据集。