基于文本相似度的测试用例复用技术研究与实现

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:cpingpeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着军用航空软件的持续发展,软件研制和质量保障过程中,积累了丰富的历史测试用例和需求文档。信息量不断增长,测试任务繁重,对软件测试人员的业务水平要求越来越高,在保障质量的同时,还需要保证测试过程的高效性和专业性。如何利用历史测试数据,来指导新的测试,是一个非常重要且严峻的挑战。测试用例复用是建立在知识积累的基础上,通过在测试过程中充分利用历史的测试用例的经验和成果,来引导新的测试。在软件做出修改或者有相似的测试任务时,使用原来的测试用例,能提高测试的效率,缩短测试时间,同时也能提高历史测试用例的价值,降低对测试人员的专业要求。基于军用航空软件需求规格说明(以下简称需求)和测试用例执行记录单(以下简称测试用例)的文档特点,本文提出一种基于文档相似度的测试用例复用方法,设计出复用模型,分析影响且提高复用度的文本相似度判断方法和标签提取策略,将测试用例复用的问题转换为中文长文档相似度判断和主题挖掘的问题,利用本文提出的方法设计并实现了基于文档相似度的测试用例复用系统,对历史需求和测试用例文档进行规范化管理和智能推荐。本课题的主要工作及创新点总结如下:1.提出了一个测试用例复用的新策略。传统的测试用例复用都是基于检索或者形式化模型来实现的,检索的方法需要记住检索关键字,形式化建模会随着文档的增加而使模型变得复杂。基于这些局限以及需求和测试用例文档的特点,本文采用自然语言处理文档相似度的方法,从文档相似度角度来挖掘需求之间的相似性和需求与测试用例的相关性。2.研究了基于文本相似度复用的方法并给出具体实现,将测试用例复用分为相似文档推荐和标签提取两个部分,将词频权重统计方法TFIDF与神经网络词向量模型doc2vec和自然语言处理主题挖掘模型LDA相结合,提出结构权重的概念,在此基础上提出测试用例复用模型。3.从文档相似度判别和标签推荐两个角度,分别设计实验,在sougou语料库和真实军用航空软件需求和测试用例文档上进行实验,验证了本文提出复用方法的有效性。4.根据本课题提出的复用策略和模型,结合某军工航空软件研究院测试用例复用需求,设计并实现了测试用例复用系统,将方法应用在实际航空软件测试过程中。该方法在实践上具有可行性,并且能提高测试用例的复用效率。
其他文献
目前,纸质食品包装材料被广泛应用于食品包装当中。本文对纸质食品包装材料及其节能环保性能、国内外纸质食品包装材料的安全法规等进行了系统地介绍,分析了目前我国纸质食品
当前中小国有企业的改制已基本完成,为企业的发展打下了坚实的基础。改制后的国有企业要保持持续、健康发展,必须进一步对自身管理体制进行改革,而企业文化的重塑作为企业管
川西成都盐盆某4井的中三叠系雷口坡组雷四段储层中富含富钾卤水。我们根据富钾卤水的赋存特征,结合其地质构造特点,利用有限的几条常规测井曲线,总结出该类储层的测井相应特
本文描述的液体吸光标准可以让你在任何光谱宽20nm以下的分光光度计上将其读数换算为“绝对”吸光度,除非仪器已坏需要修理。就作者所知,这是第一次将五种液体吸光标准的特性
基于BIM技术的钢筋模型可以用于工程量直接计算、指导施工、碰撞检查和钢筋自动加工等。虽然部分软件如Revit和Tekla可以输出钢筋工业基础类(IFC)模型,但是需要根据结构设计
1 临床资料 2001-05/2003-05收治脑脊液漏30(男25,女5)例.年龄16~56岁.其中外伤性脑脊液漏27例,自发性脑脊液漏3例.所有患者入院后均经保守治疗7 d而脑脊液漏无自愈趋势,后按
[目的]运用数据挖掘技术分析现代文献中针灸治疗糖尿病肾病(diabetic nephropathy,DN)的选穴规律。[方法]通过对中国期刊全文数据库(China National Knowledge Infrastructur
酒泉西沟四、五号墓由甘肃省文物考古研究所于1993年清理发掘出土,发掘后原址保存,为第五批全国重点文物保护单位。在出土发掘20年后,壁画出现了较为严重的酥粉、泛白以及壁
<正> 使用于冰淇淋、冰糕等冷冻甜品的主要稳定剂概述如下: 1.琼脂:是从石花菜、紫菜等红藻类海藻中提取的一种胶状物质,它与明胶或半乳甘露聚糖等混合,可作冰糕和冰淇淋的稳
在中学阶段对于对称性的概念总是提得模模糊糊,但是在解题过程中又经常应用,本文试图从直接应用的角度来探讨对称性的相关知识.