论文部分内容阅读
近年来,以互联网、大数据、人工智能为代表的现代信息技术日新月异,软件应用、存储、计算能力、数据等许多资源都被打包成服务的形式交付用户使用,服务作为一种新兴的软件资产正在逐步兴起。服务计算作为一种新的计算范式,为企业内部和跨企业的应用程序集成和协作提供了分布式计算基础设施。它主张通过服务的组合来构建分布式应用程序,极大地改变了软件应用程序的设计、架构、交付和使用的方式,受到了研究界和业界的广泛关注。随着服务计算的盛行,互联网上的服务数量和服务类型迅速增加,数据来源也日益多样化,以服务及其关联为基础的“服务互联网”正在形成。服务互联网规模的不断扩大以及内部交互的复杂性给服务计算相关问题的研究带来了诸多挑战。系统科学的观点认为,系统的结构会影响系统的功能。服务互联网也是一类人工复杂系统,其(整体/全局)结构也会影响处于其中的服务的功能。因为缺少合适的表征手段,研究人员很少从服务互联网的结构角度开展服务计算相关问题的研究,导致对服务互联网的结构、功能及其动力学行为缺少充分的认识。复杂网络研究使用网络模型来研究复杂系统,通过忽略系统实现的细节,从而更有利于发现系统结构的普遍规律,为从全局的角度研究系统的内部结构提供了有力的工具,也为解决由规模和复杂性引起的服务计算相关问题提供了可能的有效途径。近年来,国内外一些研究者将复杂网络引入服务计算中,构建了“服务互联网”的复杂网络模型——服务网络,其中节点表示服务、边表示服务间的交互结构,并基于服务网络重新审视服务计算相关问题的研究。目前,服务网络的研究仍处于起步阶段,尽管已经取得了一些可喜的成果,但是仍停留在服务网络的构建以及结构分析方面,缺乏通过结构分析来指导服务计算实践(聚类、发现、推荐等)方面的相关研究。同时,对于服务网络的结构分析也不够全面。针对上述问题,本文将采取复杂网络和服务计算相结合的交叉研究方法,以“服务网络”为研究对象,以分析服务网络的结构特征为着眼点,以为服务聚类、服务发现、服务推荐提供支持为目标,围绕基于复杂网络的服务网络结构分析、基于结构相似性度量及社区挖掘的服务聚类方法、基于服务聚类和领域标签本体的服务发现方法、基于多维信息矩阵和因式分解机的服务推荐方法等服务计算中的关键问题展开研究,具体的研究内容和取得的成果包括:(1)基于复杂网络的服务网络结构分析海量服务之间的互联形成了一个超大规模的复杂“服务互联网”。复杂网络是分析复杂系统结构的有力工具,可以加深我们对系统结构的深入了解,也为我们认识、理解和研究服务互联网的结构提供了一条崭新的思路。本文提出了一种基于复杂网络的服务网络结构化分析方法,并以真实的服务库ProgrammableWeb(PWeb)为载体开展实证研究。我们构建了 PWeb的服务网络,并引入复杂网络中的结构参数(度分布、度中心性、介数中心性、接近度中心性、PageRank值、网络核数、聚集系数等)分析服务网络的结构特征。结果表明,服务网络具有明显的“无标度”和“小世界”等复杂网络特性;度中心性是识别服务重要性的最佳参数,但是各个参数之间的差异并不明显。(2)基于结构相似性度量及社区挖掘的服务聚类方法服务聚类技术通过将相似的服务聚类成簇以降低服务的搜索空间,从而有效地提高服务发现方法的性能。因此,提高服务聚类方法的性能具有重要意义。研究表明,结构相关的相似度指标比语义相关的相似度指标在服务聚类方面表现的更好。鉴于此,本文提出了一种基于结构相似性度量及社区挖掘的服务聚类方法:首先,构建多种不同类型的服务网络抽象服务间的隶属、依赖和相似关系;然后,基于所构建的服务网络评价服务间的相似性;最后,引入社区挖掘算法识别服务网络中的社区结构,从而实现服务聚类成簇(即每个社区对应一个服务类)。PWeb数据集上的实验结果表明,与同类工作相比,我们提出的方法具有更好的性能。(3)基于服务聚类和领域标签本体的服务发现方法如何准确、高效地检索出所需的服务已成为服务使用者面临的主要问题。研究表明,基于语义的服务发现方法比基于语法的服务发现方法性能更好。因此,从服务网络角度提高语义服务发现方法的性能具有重要意义。本文提出了一种基于服务聚类和领域标签本体的服务发现方法:首先,基于研究内容(2)识别的服务类别构建各服务类别的领域标签本体;然后,引入敏捷开发中用户故事的概念,以敏捷需求三要素描述用户的服务需求及服务的描述信息;最后,通过计算用户需求与标签本体的相似度确定服务类别,进而通过计算用户需求与类别内服务的相似度确定所发现的服务。PWeb数据集上的实验结果表明,与同类工作相比,我们提出的基于领域标签本体的服务发现方法能够快速响应用户需求,具有更好的性能。(4)基于多维信息矩阵和因式分解机的服务推荐方法随着Web API和Mashup应用的不断发布,出现了大量具有相同或类似功能的Web API和Mashup应用。如何根据用户非结构化的自然语言表述的需求,快速有效地找到或推荐出满足开发者复杂请求的Web API服务集,是目前服务计算领域的研究热点。现有研究表明,结合功能特性和非功能特性的混合特性的服务推荐方法具有更好的性能。本文提出了基于多维信息矩阵和因式分解机的服务推荐方法:首先,利用依存句法关系挖掘Mashup服务描述文档中的语义信息;其次,基于内容和Mashup与Web API服务间的调用关系计算Mashup间的相似度,同时基于研究内容(2)对Web API服务进行基于结构的相似度计算;将Mashup和Web API服务相似度、Mashup与Web API服务间的链接信息、Web API服务的流行度与共现性融合生成多维信息矩阵;最后,利用FM(Factorization Machine,因式分解机)模拟输入变量与多维信息之间的所有交互,预测目标Mashup和API服务之间的关联关系,从而提高面向用户开发Mashup服务推荐API服务集的准确性。PWeb数据集上的实验表明,与同类工作相比,本文提出的方法显著地提高了服务推荐的准确性。