论文部分内容阅读
与传统的口碑相比,社交媒体的普及使得在线评论突破时间和地域的限制,传播速率更快,影响面更全,已成为消费者的重要参考依据。因此,如何利用在线评论预测销售业绩是目前销售行业研究的一大重点。前人关于在线评论的研究多采用粗粒度情感分析方法,即采用评论整体的情感倾向作为在线评论情感倾向的度量。但在评论时常会肯定某些方面的同时否定其他方面,由于这些正面和负面评论的影响互相抵消,致使粗粒度分析未能准确地量化评论的情感倾向。为了客观了解顾客的产品感知,更加接近消费者真实的情感表达,需要提取消费者评论的特征或属性并确定消费者对其情感态度,即对在线评论细粒度的剖析可以提供更为准确的信息。基于此,本文以消费者的评论文本为研究基础,以我国电影市场为背景,从细粒度情感分析角度考察在线评论情感倾向与票房收入之间的关系。首先,提出一套结构化的流程方法计算细粒度情感指数,具体而言:(1)爬取豆瓣影评,完成Jieba自定义分词、去停用词以及词性标注等数据清洗操作;(2)分别利用Word2vec技术和SO-PMI方法扩充本文的特征词库和情感词典;(3)采用语义和句法分析相结合的方式抽取含有特征-观点对的主观评论句并引入深度学习模型LSTM实现情感倾向判断;(4)结合特征出现的频率以及特征的情感极性计算特征权重值,采用看涨指数公式构造每日的细粒度情感指数。然后,基于540条面板数据,构建细粒度情感指数与票房收入的固定效应模型。此外,为了考察网络搜索指数可能对在线评论数据源的潜在补充作用,本研究在原模型的基础上引入网络搜索指数变量,通过面板向量自回归模型检验细粒度情感指数、网络搜索与票房收入三者之间的作用关系。本文的研究结论如下:(1)实证研究结果表明本文构建的系统化提取特征-观点对并计算对应的细粒度情感指数的流程方法是有效的。基于细粒度情感指数的固定效应预测模型不仅能对销量变动做出更多的解释,同时也具有更高的预测精度(R~2=0.70,MAPE=0.352,RMSE=1.321)。(2)本文研究了网络搜索指数与社交媒体网站上公开可用的评论数据之间的相互作用。结果表明网络搜索指数与在线评论中的信息不重叠,网络搜索指数包含在线评论之外的预测信息,对细粒度情感指数的预测能力有潜在补充作用。本文丰富了评论挖掘、网络搜索、票房预测等有关领域的研究,细粒度情感指数构建方法可以为在线评论在其他领域的扩展提供参考。本文建立的票房收入预测模型可以为各影院公司合理制定个性化宣传策略、安排电影放映场次提供依据。