论文部分内容阅读
近年来,中国经济飞速发展,早已成为全球第二大经济体,人民生活水平不断提高,人民享受生活的方式越来越多样化,看电影则是主要的形式之一。随着观众人数的激增,电影市场规模也在逐渐扩大。根据国家电影局数据显示,2018年全国电影总票房为609.76亿元,我国已坐稳全球第二大电影市场。21世纪,互联网技术日新月异,随着手机的普及以及众多观影APP如雨后春岁般的涌出,人们可以随时随地的在网上购买电影票以及发表观影评论。根据观众的影评,可以得知他们的情感倾向,深度剖析观众对于电影的看法,从中总结出优点以及不足,指引电影业朝着更好的方向发展,使得观众影评的价值最大化。本文从猫眼APP爬取了动作、喜剧、青春以及悬疑四个类型共八部电影的影评,首先对影评进行预处理,然后使用FV-SA-SVM将影评划分为积极评论和消极评论两类,结果显示FV-SA-SVM算法的准确率分别达到了97.8%、95.3%、96.1%以及97.4%。接着将这种分类算法与SA-SVM算法、传统分类算法进行比较,发现FV-SA-SVM算法的准确率、精确率、召回率以及F1-Score这四个指标均优于SA-SVM算法和传统分类算法,从而验证了FV-SA-SVM算法在影评情感分类上的优越性能。而后将此模型应用于《上海堡垒》、《战狼2》以及《红海行动》这三部动作电影的情感分类,分类准确率分别是94.7%、93.4%以及92.9%,均优于SA-SVM以及传统分类算法。接下来对分类后的数据使用情感字典打分的方法获取影评的情感值进行统计分析;而后对影评进行语义网络分析,构建语义网络,实现数据可视化;再对影评进行主题挖掘,提取出现次数最多的前4个主题,挖掘电影特征;最后使用k-Means算法进行聚类分析,通过对比聚类结果发现动作片中观众最在意的是电影特效、演技动作这两个方面,低分动作片是因为这两个方面做的并不好,最后本文根据这两个方面提出了相关的建议。本文研究的结论,即可以帮助电影制片商了解观众需求、从而改进自身电影作品,同时也可以帮助其他观众选择是否观看此电影。