移动应用缺陷报告的文本聚类技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:wangtongqc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动应用缺陷报告是一种用于展示移动应用缺陷和问题的报告形式,它通常由图片、文本、运行脚本等多种形式的内容组成。随着移动应用市场的快速发展,移动应用中的缺陷也越来越多的影响着用户的使用,为了获得更高质量的移动应用,需要对移动应用进行充分的、全面的测试。通过对移动应用缺陷报告的研究与分析,可以更好地完善、提升移动应用的质量与性能,本文着重研究利用文本聚类的技术来对移动应用缺陷报告进行分析。首先,本文对自然语言处理领域中文本挖掘技术进行了介绍,阐述了文本分类、文本聚类等的基本概念,介绍了常用的算法以及它们的优点和局限性。同时还对在文本挖掘过程中使用到的文本预处理技术进行了简述。然后本文建立了一个使用半监督的文本聚类方法的移动应用缺陷报告聚类系统,该系统首先利用传统KMeans方法对移动应用缺陷报告进行聚类,并利用数据可视化手段对分析结果进行展示。同时,通过该系统收集到一部分的缺陷报告的标识数据,并以这些数据构造出约束集合,通过Cop-KMeans的方法来调整聚类结果,提升准确度。本文对聚类系统的架构及技术进行了阐述。最后的实验部分,通过调整实验数据集以及实验参数,反复进行多次实验对比,验证了在移动应用缺陷报告中使用文本聚类技术的可行性,并对传统的无监督聚类方法KMeans与半监督聚类方法Cop-KMeans进行对比实验,结果证明Cop-KMeans方法具有更高的准确度。
其他文献
【摘 要】 在课堂教学中,教师应该把改进自己的教法和指导学生的学法有机结合起来,有效地发挥学生的主体作用,达到教和学的和谐发展。 充分发挥学生这个主体的作用,从而优化小学语文教学。  【关键词】 课堂;发挥;教学  【中图分类号】G62.23 【文献标识码】A 【文章编号】2095-3089(2015)20-0-01  “阅读教学的最终目的是要使学生自己能读书,不待老师讲。”这是叶圣陶先生的话
【摘要】目前在教学过程中存在很多的问题,如教材与实际操作脱节,学生没有兴趣,上完课就会忘记上课内容,不能加深学生的印象。所以我们应该转变思维,增加师生互动、对学生鼓励和沟通使老师能够有效的了解学生的思想动态,适时作出调整。  【关键词】互动 高效 师生关系  【中图分类号】G633.67【文献标识码】A 【文章编号】2095-3089(2015)16-0240-01  通过高效课堂途径与方法学习和
蚯蚓是一种典型的土壤动物,在黏湿的土壤条件下,也能活动自如而毫不粘土。蚯蚓整个体表或全身都具有优良的减粘降阻功能,这是其体表非光滑、体表电渗、体表柔性、体表润滑及
介绍了建立一套完整的医用电动吸引设备的计量标准的必要性,重点针对人体的各项生理参数进行调整,形成一套完整的医用电动吸引设备的计量标准,涵盖设备的外观要求、性能要求、环
天然气因其经济性、清洁性、高热值的特点,作为21世纪替代煤、石油的重要能源,并被广泛使用。为完成全省天然气省级管网组建,构建浙江省南部天然气能源供应通道,完善西二线下