论文部分内容阅读
近年来,随着社会经济的不断发展,人们的生活水平不断提高,普通大众对汽车这一代步工具的需要也慢慢加大,汽车消费需求慢慢变成生活中必不可少的一部分。汽车行业成为一个新型朝阳行业,对我国的经济实力的提高做出很大贡献。从消费心理上看,现在消费者已经从过去的盲目消费改变成理性消费,汽车消费者会按着自己的喜好、经济状况以及汽车的性价比来选择适合自己的车辆。同时,随着互联网的不断普及,电脑、无线端电子设备成为人们获得所需信息的重要途径。据中国互联网络中心研究数据显示,近年来,人们对互联网的需求越来越频繁,90%左右的消费者通过网络来搜索获取自己需要的信息。我们可以从主要的搜索引擎网站(百度、谷歌等)获得消费者的搜索数据,从这些数据可以挖掘消费者的真实心理需求,这对一个行业的市场分析和研究具有重要的战略意义。汽车销量的预测在宏观上有利于汽车行业产能监控、避免产能过剩、把控行业成长趋势、促进行业更好发展,微观上有利于车企制定生产营销策略、平衡供需、优化供应链。论文旨在研究大数据背景下,网络搜索数据、评价数据与汽车销量之间的关系,并建立预测模型对汽车销量进行预测。首先分别检验评分数据、百度指数数据与汽车销量之间的相关关系,发现评分数据与销量不存在相关关系,而百度指数与销量数据存在强相关关系。然后从人们消费主流品牌中,选中宝马、大众、吉利这三个高中低档品牌做相关的分析,使用网络爬虫工具获取关键词数据,搜索选取关键词然后进行网络搜索指数的合成,从中国汽车工业协会获取各品牌的实际汽车销售量,建立网络搜索数据与汽车销量的数据模型,和改进的时间序列模型。之后将时间序列与回归模型结合,得到精度更高的混合预测模型。通过分析结果可以得到,百度搜索指数模型部分表明了网络搜索指数与宝马、大众、吉利三个不同档次的品牌汽车之间的相关关系;其次,从拟合优度和预测精度来看,百度指数模型和时间序列模型都达到了较好效果;第三,混合模型的拟合优度和预测精度均优于前面的百度指数模型和时间序列模型。其中,吉利汽车作为低端品牌在拟合优度和预测精度上的表现都较普通,其拟合优度是89.83%,而预测误差也很大,为8.18%;而大众作为中端消费的代表,拟合优度是96.14%,预测误差是3.31%;宝马这个高端品牌的拟合优度比中低端汽车品牌都要理想,达到了96.81%,误差也是最小的,仅为1.88%。