论文部分内容阅读
近些年来,随着互联网技术的不断普及与发展,人们随时随地都可以在网络上发表自己对于新闻、产品、政策方针等的观点和意见。人们在各大社交媒体上发表的信息,不仅对于用户购买商品的决策起到重要作用,同时对商家了解用户体验,根据用户意见调整产品性能、质量和服务等也有很大的帮助;政府在制定政策后,通过这些评论了解民众意见,及时调整政策和完善政策,促进社会和谐发展,同样有很好的指导价值。然而随着评论信息的指数型增长,如何从这些主观性评论数据中提取出有价值的信息,成为目前研究的热点问题。情感分析又称情感倾向性研究,通过对词语、短语、语句等处理,识别其中情感倾向和情感强度,挖掘有价值的信息。情感分析领域大多是从基于词典和基于机器学习两个方向来研究。但是情感分析涉及的维度是从对评论内容本身处理,没有考虑评论中包含的哪些因素会影响到购买者的态度和决定,哪些因素对用户的购买决策更有吸引力,用户认为什么样的评论更有说服力,因此本研究试图从另一视角进行情感分析,使其能够将在线评论的影响因素加入到情感分析中,提高对有价值信息的挖掘效果。本文的主要工作如下:(1)针对传统情感强度计算没有深入考虑修饰词对极性词影响的问题,提出了面向评论文本的情感极性计算方法。首先分析评论文本中的词性、句式结构;然后对评论数据中的各种修饰词、情感词之间的组合进行深入研究。由于传统的情感强度计算方法将不同词性的组合对极性词的差异影响作同等权值的计算,因此本文提出了根据不同的词性组合制定不同的权值的计算方法。实验验证得出本文提出的情感极性计算方法比传统的基于情感词典和规则的方法在情感倾向性判别上效果更好。(2)针对以往情感分析研究的单从评论内容本身出发,没有考虑评论的有用性因素对用户购买决策的影响,提出了基于在线评论影响因素的情感分析方法。首先介绍了评论有用性的理论基础,提出符合本文研究内容的理论模型;然后利用相关性分析、回归分析等验证了所提理论模型的合理性;接着在情感分析中制定代表商品类型、评论长度、评论极端性等有用性影响因素的规则;最后利用情感极性计算方法,获得最终情感倾向得分。实验结果表明该方法加入评论有用性影响因素有助于修正情感倾向性的判别,并且可以凸显对评论所含价值的分析与挖掘。