论文部分内容阅读
万维网产生之后,将遍布全球各地的计算机联系到一起,这些计算机中的数据资源组成了规模庞大的数据库。面对如此庞大的数据库,寻找真正想要的信息无异于大海捞针。如何发现大量数据中隐藏的、真正有用的信息,仅仅靠传统的统计学方法与信息检索方法是不能解决上述问题的。正是在上述背景下,数据挖掘技术应运而生。从大量数据中快速有效地获得最有价值的信息资源在当今信息时代具有重要意义。因此,与数据挖掘相关的技术和工具面临很好的发展前景。其中,分类预测技术作为智能决策的重要手段将在智能系统中发挥重要作用,而如何快速准确的对一个新的Web服务预测判断其性能则成为目前研究的热点和难点。在国家863项目-基于分层适应策略的网构软件环境感知与演化技术的阶段性优化模块中,针对组合服务环境自适应运行支撑平台的阶段性优化升级,并以QoS规则挖掘阶段得到的QoS规则为基础,本文提出了基于QoS规则的Web服务性能预测方法。根据当前分类算法的发展方向,并针对关联规则及显露模式两种不同知识模式,研究设计了两种服务性能预测方法。在两种方法中,分别给出了几种QoS规则度量标准及定义,研究了新的规则裁剪算法,并提出了有效合理的评分标准及分类策略,为准确有效的预测新的Web服务实例的性能类别提供了宝贵的思路和改进。本文首先研究了基于QoS规则的Web服务性能预测框架,从整体上把握了对未知Web服务进行性能预测的主体思路,并根据预测方法中的主要组成部分设计出性能预测方法的基本流程。其次,提出了基于反馈准确度的Web服务性能预测方法CBFA,给出了反馈准确度、综合度量值等度量标准的定义,提出了“父子”关系、优先级、最优规则等思想,研究了新的规则裁剪算法,并在评分标准及分类等方面给出了新的解决策略,然后通过实验来分析证明CBFA具有更好的分类准确度。最后,提出了基于显露模式的Web服务性能预测方法CBEP,在分析了经典的显露模式分类算法的基础上,给出了算法CBEP的预测模型及预测流程,改进了最小增长率阂值确定问题的方法,并针对每个类别,分别选取不同的最小增长率阈值。另外,在评分标准方面,提出了标准化的思想,使得对未知服务的性能预测更加合理准确。