基于Spark的并行化组合测试用例集生成方法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:tuantuan731
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件系统的正常运行受很多因素影响,各种因素及其相互作用可能引发软件故障,需要设计测试用例检测这些故障.如果因素数量较多且取值情况较复杂,则所需测试用例的数量将非常庞大.如何设计规模较小的用例集是测试用例生成研究的一个关键问题.组合测试能够从待测软件的大规模组合空间中,生成小规模的用例集,实现对各因素取值组合的充分覆盖.已有研究表明,组合测试的最小测试用例集生成问题是一个NP完全问题.目前已有一些研究尝试使用启发式搜索算法生成尽可能小的用例集.启发式搜索算法将组合测试用例集生成问题转化为搜索问题,并使用元启发式算法生成用例集.启发式搜索算法通常能够生成较小规模的用例集,但需要较长的计算时间.为了解决这个问题,文中提出了一种基于Spark的岛模型并行化遗传算法,利用Hadoop分布式文件系统实现了Spark运行节点间交换信息的方法,进而实现个体在子种群间的迁移.该算法首先从初始种群创建Spark的弹性分布式数据集;然后,将该数据集划分为多个子种群分布到集群的多个节点中;接着,各个子种群在各自的节点上计算适应度函数值和独立进化,并每隔一定的进化代数选择一些个体在各个子种群间迁移,提高了种群的多样性以及搜索最优解的有效性和性能;最后,算法返回满足覆盖准则的最优测试用例集.这种基于Spark的并行化遗传算法是大规模并行化在组合测试用例集生成方面的一个有效尝试.在实验部分,首先对文中提出的并行化算法进行系统的参数调整,给出适合组合测试用例集生成的推荐参数配置;接着将文中所提算法与串行遗传算法和独立运行遗传算法进行比较.实验结果表明,文中所提算法在生成用例集规模和消耗时间上均显著优于这两个算法.在运行所选实例时,该算法比串行算法加速约4至30倍,比独立运行遗传算法加速约2至3倍.相对于已有的组合测试用例集生成方法,文中所提算法在生成用例集规模上也具备显著优势.
其他文献
依据两亲性分子和煤沥青分子的结构特点,设计并制备了两亲性煤沥青。以中温煤沥青为原料,浓硫酸为磺化剂制备两亲性煤沥青,考察温度、时间、改性剂等因素对沥青水溶物含量的
<正> 辽西主要是指辽宁西部,北起北纬42°50′,南至北纬40°25′,东起123°,西至118°55′左右。属于努鲁儿虎山、松岑、医巫闾山地区;大凌河中上游,小凌河、绕阳、柳河上游
随着最新会计准则的颁布,新型的会计核算标准在我国各大上市公司开始正式实施。新会计准则的实施改变了过去旧会计制度下的薪酬核算方法,使企业对于职工薪酬核算更加规范性和
近几年化妆品行业异军突起,保持着强大的增长态势,随之化妆品广告的比例也迅速的上升,本文研究的是时尚类杂志的化妆品广告的特点,文中根据化妆品广告的特点将其分为:整版广
微/纳米科学技术作为二十一世纪的关键高新技术之一,将导致人类认识和改造世界能力的重大突破。而具有强烈交叉学科色彩的微系统(或微机电系统,MEMS)可能迅速崛起和蓬勃发展,成为
环糊精在有机合成中的应用一直备受化学家的关注。它在有机合成中的化学行为主要有以下两个方面:其一,环糊精与反应试剂通过共价键形成反应中间体,使其具有特定的化学反应性能和
本文精选了50味平性药及50味对照非平性药作为研究对象;从各味药的有效成分入手,利用其所含有的特定的骨架及官能团信息直观地进行了数字化表征;采用模式识别中的支持向量机
该文通过对长江三角洲地区的区域特征和生态环境现状分析,建立了区域环境质量评价层次模型,结合区域生态经济综合发展目标,揭示出区域生态环境建设规划的内涵及其在资源开发利用
比较精纯抗栓酶与降纤酶治疗脑梗死的疗效。方法 :6 0例脑梗死患者随机分成两组 ,分别使用精纯抗栓酶与降纤酶治疗 ,对其临床神经功能缺损程度进行评分 ,并观察用药前及用药
能源是现代文明的三大支柱之一,制约着国家的经济、科学技术的发展。目前,世界各国能源消耗不断上升,但是其利用率却不高,存在着很大的浪费,使得能源的供给渐趋紧张,有枯竭的危险。