论文部分内容阅读
随着云计算技术的飞速发展,Web服务作为其关键技术之一被广泛应用,互联网上可用Web服务数量快速增长,因此如何快速准确定位Web服务,实现服务发现和组合变得十分必要和困难。目前网络上发布的Web服务多基于WSDL进行描述,因此如何有效利用WSDL进行服务发现显得尤为重要。由于WSDL缺乏对Web服务的语义描述,存在相似度匹配准确率低的问题,而且很多WSDL文档结构缺乏规范性,现有Web服务相似度计算方法不能够有效满足需求。Web服务标签是用户向Web服务添加的描述其功能或属性的关键词,它可以向Web服务提供额外的信息,弥补WSDL提供信息不足的问题,从而提高Web服务相似度匹配的准确率,进而改善服务发现、服务组合和服务聚类等,然而目前不准确甚至错误的无效标签比例较高,影响了服务相似度匹配的质量。针对当前WSDL结构描述缺乏规范性和描述Web服务的无效标签比例较高的问题,本文提出一个Web服务标签优化模型WS-TOM,该模型分为Web服务相似度计算和Web服务标签优化两个模块。在Web服务相似度计算模块,首先分析了大量的WSDL文档,给出一种考虑到编程风格和命名规范的特征提取方案,用于Web服务相似度计算;在Web服务标签优化模块,给出了一个标签排名算法,通过综合标签与WSDL的语义相似度和标签的信息量来对标签进行排名,然后根据幂律分布的规律,过滤不准确的标签,从而降低其负面影响。实验结果及分析验证了WS-TOM模型的有效性,Web服务相似度计算方法在WSDL结构不规范的情况下能够良好执行并能一定程度上提高相似度匹配的准确率;Web服务标签优化能够过滤不准确的标签,进一步提高了Web服务匹配的准确率。