服务网络中若干关键问题的研究

被引量 : 0次 | 上传用户:gongshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着服务经济的全面发展,服务产业链的日趋完善,以服务科学和服务计算为代表的研究领域也得到了较大发展。Web服务相关技术的应用和SOA (Service-Oriented Architecutre)架构的广泛采用和部署,在线服务大量涌现,服务使用的广度和深度得到了不断延伸,Web服务的使用呈现规模性、演化性、动态性和资源需求弹性化。为了应对Web服务管理和使用规模化、服务系统内部组织结构日趋复杂化、实施部署和维护成本逐步提高等挑战,以网络化、复杂化的视角进行相关研究已成为必然趋势。本文以复杂网络理论和分布式计算为指导思想,以应对服务网络中大规模Web服务的组织和管理为目的,就Web服务的查找、使用、管理和部署等方面的若干关键技术开展相关研究,以保证Web服务的广泛使用和高效运行,在松散的服务网络体系架构的基础上,从如何高效选择Web服务、如何分发服务、如何更好地部署服务三个方面出发,研究了服务的功能性聚类、服务质量预测、服务路由以及云集群中云负载预测四个方面。通过对服务功能性区分和质量值辨别,以便于服务使用者利用服务路由机制选择合适服务,从而方便的部署在具备伸缩性和扩展性的云集群主机中。本文主要的创新点为:1)针对服务网络中服务数量规模过大而导致服务选择效率低下的问题,提出了一种邻近性标签传播算法TopLPA (Top Label Propagation Algorithm)及在线化形式即在线邻近性标签传播算法TopLPA-Online (Top Labe Propgatation Algorithm Online),以对服务进行功能性聚类。其中TopLPA算法首先对服务描述特征进行抽取,以进行服务相似度的计算,在服务相似度计算中融入了多种语法特征以及相应的语义特性,保证了服务相似度计算的可靠性和丰富性;然后形成相应的服务相似网络,且在进行节点类标签更新时只考虑较为邻近的邻居,从而能较好过滤噪声邻居。TopLPA效果较已有的LPA算法在准确率指标上平均提升5.17%。此外,TopLPA-Online将新加入服务所形成的服务相似网络与原有网络结合,避免重新对所有服务进行分类,进而提升算法效率,该算法较TopLPA能够在时间效率上至少节约21%,具备较好的实际应用价值。(第二章,学术论文成果[4])2)针对服务网络中大规模服务质量预测时的数据稀疏性问题,提出了基于WAA的使用者位置感知混合预测HUWAA (Hybrid User-Location-Aware Prediction based on Weighted Adamic-Adar)和基于WRA的使用者位置感知混合预测HUWRA (Hybrid User-Location-Aware Prediction based on Weighted Resource Allocation)算法。上述两种算法核心思想均是基于链路预测方法来发现隐藏邻居以提高预测的精度和成功率。在利用给链路预测方法进行隐藏邻居发现时,首先构造了使用者相似网络和服务相似网络,然后将链路预测算法进行适当修正并用于网络中隐藏邻居节点的寻找,其中在使用者相似网络中寻找隐藏邻居时充分考虑位置邻近性。仿真结果表明,所提的HUWAA和HUWRA均较已有的UPCC(User-based Pearson Correlation Coefficient)、IPCC (Item-based Pearson Correlation Coefficient)和WSRec (Web Service Recommendation)在MAE(Mean Absolute Error)、RMSE (Root Mean Square Error)和FR (Failure Rate)指标上均有所提升。其中HUWAA较IPCC在MAE. RMSE和FR指标方面分别平均提升为7.59%、5.77%和48.1%; HUWRA较IPCC在MAE、RMSE和FR指标方面分别平均提升为10%、8%和48.8%。(第三章,学术论文成果[5,9]以及专列成果[4])。3)针对服务网络中服务发现和路由中单点性能瓶颈以及单点失效的问题,提出了一种基于词集索引的范围查找路由方法TISRQ (Term-set Indexing Support Range Query)。该方法选择与服务描述文档最为相似的若干关键词集以对服务建立索引,并充分考虑服务使用者请求关键词流行度,不仅降低了节点关键词索引的数量,同时还提高了算法准确率。此外该方法基于MAAN(Multi-Attribute Addressable Network)进行拓展,以支持对服务质量值范围的查询。相应的实验仿真表明,TISRQ方法和已有的基于词集索引的多属性路由方法TSM (Term-set Indexing for the Multi-Attribute Addressable Network)与单关键词索引方法相比节省了75%的索引,同时TISRQ较TSM在准确率方面提升了6.09%。由于服务运行环境负载多变,在服务具体执行时相应服务质量并不一定与声明的SLA (Service LevelAgreement)一致,这里提出了相应的可违例SLA服务评价方法,该评价方法使得服务使用者可定义动态的SLA,根据周期性检测形成客观的服务评价,具备较好的实用性和准确性。(第四章,学术论文成果[2,6]以及专利成果[3])。4)为了更为精确的对云主机负载进行预测以便于云资源管理和负载均衡,提出了一种基于分类的云主机负载预测方法,该方法基于已有的ESP (Exponentially Segemented Pattern)指数预测模式,将主机负载预测问题转换为分类问题。此外在已有的特征基础上,由于加入了新的特征,使得分类算法用于负载预测时,性能得到提升。通过对实际Goolge云主机负载数据的实验仿真,新特征Fir(e)相对于特征Ffi(e),对预测算法精确度提升效果更好。将多种分类算法用于云主机CPU负载预测中,发现MMSE-BC (Minimized MSB Based Bayes Clssifier)、N-BC (Naive Bayes Classifier)和SVM (Support VectorMachine)的表现较为良好,三者较其它负载预测算法在SR(Successful Rate)上高出50%、而MSE (Mean Square Error)减少了17%。(对第五章,对应学术论文成果[3,7])。
其他文献
<正> 大多数毒品检验方法只有当毒品是在检查的几天前服用时才能显示出正确的结果。但是加利福尼亚圣克拉拉的心理化学医学公司(Psychemeaics)正在研制的一种系统却能通过检
<正>销售合同是规范交易双方权利义务的法律依据,同时又是证明纳税业务发生的凭据,也是税务机关在对企业应税行为进行确认时的主要依据之一。一项经济业务是否缴税以及按照什
准确的个体记录数据是现代蛋鸡饲养管理工作的基础,个体记录数据的准确性直接影响蛋鸡生产管理工作的成效,个体记录系统可在第一时间掌握养殖场内鸡群的生产状态,有针对性地
在中小学开展校本教研有助于教师的专业成长和学校教学质量的提高。目前不少地方的中小学校本教研存在着选题好"大"、研究主体错位、研究水平不尽如人意等诸多问题,从而使校
我国养老保险基金由两部分组成:社会统筹基金和个人账户基金,而个人账户基金是养老保险基金的主要组成部分。个人账户基金的资产安全和保值增值是经济社会健康、稳定、可持续发
<正>《微访谈》是建立在新浪微博基础上的访谈类产品,是由新浪微博打造的一款明星、名人与网友线上互动交流的栏目。①2011年10月31日,《微访谈》推出一年后,共开通了48个栏
<正>当前,我国纪录片生产正处于转型与复兴的关键时刻,但对于地方广电媒体特别是城市台和县级台来说,促进纪录片的繁荣发展,还是个相对生疏的问题。为此,地方城市台和县级台
陀螺仪的漂移、载体的线性加速度和磁场的干扰是影响MARG传感器姿态测量精度的主要原因。针对传统姿态测量算法在磁干扰环境下由于航向角误差导致水平角测量精度降低以及载体
基于学生思维过程的教学应该给学生提供一个展示自我的平台,分享自己的思考,暴露自己学习的问题,在展示与交流的过程中实现认知、思维的多维发展。
<正>上世纪80年代以来,典型报道陷入困境,表现为典型报道的传播效果日趋式微、报道的数量和篇幅日渐缩减。分析其原因,有社会环境转变的因素,有典型报道操作上的一些缺陷。同