论文部分内容阅读
随着汽车行业的快速发展,汽车各生产商间的竞争也日益加剧。汽车质量作为汽车生产商核心竞争力的体现,是其在市场中立足的根本和发展的保证,了解并掌握汽车质量问题是维护品牌声誉与减少企业损失的重要手段。随着互联网的逐渐普及,大量专业性的汽车论坛如雨后春笋般出现。用户在论坛中既可以无约束地表达自己的述求和真实体验,又可以与其他用户进行广泛地交流和讨论。论坛的快速发展为用户表达用车体验提供了便利,同时,论坛中隐含的大量、丰富的有关汽车质量的用户体验信息也为企业全面高效地获取汽车质量问题创造了条件。本文通过分析基于网络论坛数据的产品质量问题挖掘的研究现状,发现以往研究很少结合论坛数据特点对质量问题进行深入探讨,现有提取质量问题的模型及方法也相对匮乏。为此,本文针对论坛数据和用户体验的特点,对用户的用车体验中隐含的汽车质量问题进行深入挖掘,提出一种系统性挖掘汽车质量问题的方法,并利用实际的论坛数据验证了本思路的可行性与有效性。具体的研究内容如下:(1)汽车质量问题相关文本的识别方法。首先分析了论坛及数据的特点,在其基础上进行数据采集及预处理等准备工作。之后,结合论坛数据的这些特点,提出针对性地选取多种文本特征的方法,并利用这些文本特征与数据标签及分类算法共同构建文本分类模型,识别出用户体验中涉及汽车质量问题的文本。最后,用实例验证了特征选取方法及文本分类模型的可行性与有效性。(2)汽车质量问题的提取方法。首先结合论坛数据的特点,分析用户体验中的汽车质量问题对应汽车部件与问题类型间的关系,提出一种针对论坛数据特点的汽车质量问题的提取思路及流程。之后,基于该思路,将汽车质量问题拆分为汽车部件及问题类型,提出采用Apriori算法提取涉及汽车质量问题的汽车部件,并采用语义K-means聚类及层次聚类凝聚算法提取汽车部件对应的问题类型,二者组合从而得到汽车质量问题。最后,用实例验证了本文提取方法的可行性。本文针对论坛数据特点提出的汽车质量问题挖掘方法,扩宽了数据挖掘、信息检索的研究领域,实现了二者与质量管理的有机结合。并且在实际应用中,能够帮助汽车生产商及时获取并分析可能存在的汽车质量问题,辅助企业进行管理决策,在质量管理过程中具有重要意义。