基于语义相似度和信息量的Web服务标签优化

来源 :郑州大学 | 被引量 : 0次 | 上传用户:liongliong534
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算技术的飞速发展,Web服务作为其关键技术之一被广泛应用,互联网上可用Web服务数量快速增长,因此如何快速准确定位Web服务,实现服务发现和组合变得十分必要和困难。目前网络上发布的Web服务多基于WSDL进行描述,因此如何有效利用WSDL进行服务发现显得尤为重要。由于WSDL缺乏对Web服务的语义描述,存在相似度匹配准确率低的问题,而且很多WSDL文档结构缺乏规范性,现有Web服务相似度计算方法不能够有效满足需求。Web服务标签是用户向Web服务添加的描述其功能或属性的关键词,它可以向Web服务提供额外的信息,弥补WSDL提供信息不足的问题,从而提高Web服务相似度匹配的准确率,进而改善服务发现、服务组合和服务聚类等,然而目前不准确甚至错误的无效标签比例较高,影响了服务相似度匹配的质量。针对当前WSDL结构描述缺乏规范性和描述Web服务的无效标签比例较高的问题,本文提出一个Web服务标签优化模型WS-TOM,该模型分为Web服务相似度计算和Web服务标签优化两个模块。在Web服务相似度计算模块,首先分析了大量的WSDL文档,给出一种考虑到编程风格和命名规范的特征提取方案,用于Web服务相似度计算;在Web服务标签优化模块,给出了一个标签排名算法,通过综合标签与WSDL的语义相似度和标签的信息量来对标签进行排名,然后根据幂律分布的规律,过滤不准确的标签,从而降低其负面影响。实验结果及分析验证了WS-TOM模型的有效性,Web服务相似度计算方法在WSDL结构不规范的情况下能够良好执行并能一定程度上提高相似度匹配的准确率;Web服务标签优化能够过滤不准确的标签,进一步提高了Web服务匹配的准确率。
其他文献
在经济快速发展,人民生活水平稳步提升的新时代,网购已经成为当下最为流行的购物方式。化妆品作为日常生活用品,其需求量日益提升。然而,关于网购出现假冒伪劣的化妆品事件不
信息社会中我们需要依赖于各种各样的计算机系统,为了保存各类信息,从个人到整个社会如何存储海量数据显得非常重要。但计算机系统在处理能力快速提高的同时,存储能力成为制约计
在普适计算环境下,信息空间(虚拟世界)与物理空间(现实世界)高度融合,在这个高度融合的空间中,人们可以随时随地、透明地获得数字化的服务。随着普适计算研究不断地深入,普适计算所面
分形理论在通信、现代医学、流体力学、纺织科学、工业设计、文化艺术、计算机科学等学科也得到广泛的应用。形式化方法是一种基于数学方法的规约,技术和验证系统的工具。它不
粒计算融合了粗糙集、模糊集、人工智能等多学科研究成果,是研究复杂问题、海量数据挖掘和不确定信息处理等的一种有效工具。近年来,粒计算理论被广泛应用于人工智能、数据挖
随着网络通信技术与多媒体技术的飞速发展,数字多媒体数据的非法复制、处理和传播变得越来越容易。这样使得多媒体数据内容的盗版和侵权问题日益严重。如何保护数字多媒体内容
在数据挖掘应用领域(如Web页面分类),收集大量未标记的实例已相当容易,而标记这些实例却需要耗费大量的人力物力。因此在有标记实例较少时,如何利用大量的未标记实例来改善学习性
随着信息技术的发展,计算机技术已经融入了现代社会各个领域,得到极其广泛的应用。然而在这样的背景下,计算机系统的异常可能会造成灾难性后果。  测试和仿真通常被用来保障这
随着信息黄金时代的到来,人们越来越意识到数据的重要性,而从这些大量的数据中挖掘有用的信息也变得越来越困难。特别是微博的兴起,使得每天产生大量的微博文本数据,而这些微博文
随着计算机和通信相关技术迅猛发展后,网络技术越为完善,而许多使用网络技术的实际应用如金融信息、地质测量、天文观测、气象、传感网络和数据集成等,产生了大量的数据流。