基于网络论坛数据的汽车质量问题挖掘研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:ychh1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着汽车行业的快速发展,汽车各生产商间的竞争也日益加剧。汽车质量作为汽车生产商核心竞争力的体现,是其在市场中立足的根本和发展的保证,了解并掌握汽车质量问题是维护品牌声誉与减少企业损失的重要手段。随着互联网的逐渐普及,大量专业性的汽车论坛如雨后春笋般出现。用户在论坛中既可以无约束地表达自己的述求和真实体验,又可以与其他用户进行广泛地交流和讨论。论坛的快速发展为用户表达用车体验提供了便利,同时,论坛中隐含的大量、丰富的有关汽车质量的用户体验信息也为企业全面高效地获取汽车质量问题创造了条件。本文通过分析基于网络论坛数据的产品质量问题挖掘的研究现状,发现以往研究很少结合论坛数据特点对质量问题进行深入探讨,现有提取质量问题的模型及方法也相对匮乏。为此,本文针对论坛数据和用户体验的特点,对用户的用车体验中隐含的汽车质量问题进行深入挖掘,提出一种系统性挖掘汽车质量问题的方法,并利用实际的论坛数据验证了本思路的可行性与有效性。具体的研究内容如下:(1)汽车质量问题相关文本的识别方法。首先分析了论坛及数据的特点,在其基础上进行数据采集及预处理等准备工作。之后,结合论坛数据的这些特点,提出针对性地选取多种文本特征的方法,并利用这些文本特征与数据标签及分类算法共同构建文本分类模型,识别出用户体验中涉及汽车质量问题的文本。最后,用实例验证了特征选取方法及文本分类模型的可行性与有效性。(2)汽车质量问题的提取方法。首先结合论坛数据的特点,分析用户体验中的汽车质量问题对应汽车部件与问题类型间的关系,提出一种针对论坛数据特点的汽车质量问题的提取思路及流程。之后,基于该思路,将汽车质量问题拆分为汽车部件及问题类型,提出采用Apriori算法提取涉及汽车质量问题的汽车部件,并采用语义K-means聚类及层次聚类凝聚算法提取汽车部件对应的问题类型,二者组合从而得到汽车质量问题。最后,用实例验证了本文提取方法的可行性。本文针对论坛数据特点提出的汽车质量问题挖掘方法,扩宽了数据挖掘、信息检索的研究领域,实现了二者与质量管理的有机结合。并且在实际应用中,能够帮助汽车生产商及时获取并分析可能存在的汽车质量问题,辅助企业进行管理决策,在质量管理过程中具有重要意义。
其他文献
引言我国城市综合防灾规划发展改革的历史大背景是我国进入中国特色社会主义新时代,表现为国家对防灾减灾工作的日益重视、城市化发展步入“后半程”,同时我国机构改革稳步推
<正>水壶+玻璃杯这款玻璃壶11.5英寸高,由敏锐的生活方式商店KINDRED BLACK发掘——适合一个人拿到后院晒太阳,或者与朋友一起分享柠檬水。微微隆起的轮廓便于抓取,而渐变的
SD法适应于不同矿种的矿产勘查和开采阶段。本次估算主要利用河南陡坡钼多金属矿区38个勘探钻孔共3839个单工程样品数据进行了钼储量估算和工程控制程度预测工作。结果显示陡
目的总结13例侵袭性真菌感染(IFI)患儿的临床特点、感染菌种及有效治疗方法.方法对13例IFI新生儿的临床资料进行回顾性分析,总结其临床特点、感染菌种及有效治疗方法.结果13
通过分析牵引变压器安装容量与高速铁路运输组织、经济效益的关系,给出牵引变压器投资、牵引供电运营总电费的计算模型,计算更换牵引变压器的时间节点,经技术经济比选后确定
全球的包装机械需求每年以5.3%的速度增长,2005年达到290亿美元。美国拥有最大的包装设备生产商,其次是日本,其他主要生产商还包括德国、意大利和中国。但目前包装设备生产增
早些年在语文课上学过毕淑敏的文章《我的五样》,继而知道了这个撩动生命琴弦的心理游戏。时隔多年,在团体辅导课上,老师又给我们布置了这个作业。于是,我在一个寂静的夜里拿起了
期刊
人们熟知奥地利心理学家阿德勒,往往是从他所写的《自卑与超越》开始的。有趣的是,我一步步认识“宝藏爷爷”阿德勒,是从他的现代粉丝(研究者们)所著的《被讨厌的勇气》《孩子:挑战
报纸
目的:为完善我国药品价格管理制度提供参考。方法:以口服阿奇霉素为代表品种,对广东省13个地级市共112家药店的药品价格进行实地调查,收集相关数据,并采用SPSS 11.0软件进行
【目的】从苦瓜叶乙醇提取物中分离鉴定活性成分苦瓜素Ⅰ和苦瓜素Ⅱ,测定其对小菜蛾幼虫的拒食和抑制生长发育活性。【方法】用石油醚、乙酸乙酯、正丁醇和水依次对苦瓜叶片乙