论文部分内容阅读
随着面向服务计算技术的发展,互联网上Web服务的数量越来越多。面对数量众多的服务资源,如何有效地组织和管理这些服务成为了一个亟需解决的问题。分类是人们组织和管理大规模资源的一种有效手段,文本分类技术在信息组织、管理领域已经有了非常成熟的应用。然而,服务资源的特点导致服务的分类不同于传统的文本分类。作为一种软件程序模块,服务分类的依据主要来源于对服务的描述信息,如WSDL文档。但究竟应该获取服务的哪些侧面信息作为分类的依据并没有一个统一的标准;同时,常用的WSDL文档中服务类别相关的描述信息过少使得基于词频的分类方法效果并不理想。本文对服务的分类技术进行了研究。主要研究内容及结果如下:
⑴提出了一种面向分类的服务描述模型,明确了应该从服务的名称、描述、操作三个侧面去获取分类相关的信息。通过实验发现,服务分类相关的信息在其名称、描述和操作中都有分布,并且这三部分的信息对分类结果的置信度不同。
⑵给出了基于WSDL和OWL-S标准构建该模型的方法,针对这些标准中一些分类相关信息隐蔽且不能直接用于分类的问题,提出了一种基于正反向最大匹配的词汇还原方法,以充分获取服务分类相关的信息。
⑶设计并实现了一种基于WordNet的服务分类器,把面向分类的服务描述模型中的信息映射到WordNet语义词典,从语义概念上比较该服务和各类别概念的相似度,得出分类结果。最终的性能评测表明了该分类器的有效性。
⑷结合“服务资产库系统”项目中的实际问题,以一个具体的场景实例,展示了分类器的实际应用效果,说明了该分类方法的有效性和可用性。