论文部分内容阅读
数据挖掘是从数据库或数据仓库等大量的信息数据集中发现隐藏于其中的有效知识的过程。序列模式挖掘是一种按时间或其他顺序挖掘出现频率高的频繁项集。序列模式挖掘是数据挖掘领域的重要分支,有着广泛的应用,其应用研究包括网络入侵检测、网络视频推荐以及客户购买行为分析等等。近年来,随着信息技术的发展,电子信息技术已深入各企事业单位的方方面面。信息技术的应用导致企事业单位的运营管理数据呈几何级数增长,面对日益庞大的数据,如何挖掘隐藏在数据后的知识,辅助管理人员进行有效管理决策已成为亟待解决的问题。迄今,人们已开展了许多数据挖掘技术的研究与应用探索。许多研究成果己应用于电信、金融、电子商务、电子政务等领域中,但对车辆维修数据的分析,尚处在起步阶段。车辆维修有其特殊性,一辆车进行了某项维修后,由于服务的保质要求,短期内无需进行同样的维修服务。但对于车辆维修,长期的维修管理数据经分析后揭示出潜在的维修费用过高问题,比如:部分车辆维修费用逐渐变高、维修次数多,短期内部分车辆存在多次维修同种项目的情况等。本文基于序列模式挖掘算法对车辆维修记录进行了深入研究,主要研究工作如下:1.深入分析了当前车辆维修系统以及所面临的问题,说明了对于车辆维修记录,开展基于序列模式挖掘研究的必要性2.介绍了序列模式挖掘算法的相关研究背景以及近年来国内外研究现状,分析了当前各个最具代表性的序列模式挖掘算法,并且对其存在的优缺点进行了分析。3.提出了车辆维修数据的数据挖掘模型,用于指导本文的序列模式挖掘过程。4.给出了一种改进的序列模式挖掘算法APSpan算法,将改进的算法和原有算法PrefixSpan在警用车辆维修记录数据集上进行了分析与比较,说明本文改进算法APSpan的有效性。5.将改进的序列模式挖掘算法应用于车辆维修数据的挖掘中,以警用车辆维修数据作为分析数据源,开展各个维度的分析,开展了车辆维修数据的序列模式挖掘实验。经实验验证了该序列模式挖掘算法运行可靠、稳定,并有较高的效率,能应用于车辆维修数据的挖掘中。