论文部分内容阅读
随着互联网和电子商务的迅猛发展,网络为企业和消费者进行消息的发布、传播和沟通提供了便捷的途径和平台。消费者在网购商品会会依据自己的购物体验对商品的各个方面做出评价,因此,这些评论中蕴含了消费者的情感倾向。对这些情感倾向研究对于消费者、商家以及有关的管理机构进行决策活动具有重要的参考意义。对于消费者,可以在购买时提供真实的商品信息;对于商家,能够掌控商品质量和管理等方面的不足;对于相关管理机构,可以更好地进行指导监管工作。大量的在线评论信息中蕴含着丰富的情感倾向,对其进行研究挖掘出有用的信息是我们当前需要解决的问题。鉴于此,本文以真实的在线商品评论为研究对象,对其进行情感倾向性研究,尤其是在细粒度的情感倾向获取方法和强度的研究。首先,论文介绍了文本和情感挖掘方面的理论知识,包括中文分词、词性标注、文本特征抽取及其分类算法。在这些基础之上分析了在线评论的复杂性,提出了有用性评论的筛选,减少无用评论对后续情感分析研究的干扰。经过实验证明,选用IG方法进行特征选择,结合SVM方法作为分类器进行评论的有用性选择是最有效的组合。其次,本文总结了在线评论依存句法分析中特征词和评价词的构成形式及两者之间的搭配关系构成规则,提出了基于依存句法的混合特征观点对提取算法,可以更加准确地将在线评论细粒度级别的特征与观点进行挖掘,在保证基于依存句法的方法的准确率的同时提高了特征观点对抽取的召回率。然后,针对从在线评论中提取出的特征观点对,本文采用基于《知网》的情感倾向性方法进行情感倾向的判断,对具体的评论信息实现了在产品属性上的情感倾向性分析,得出了产品的竞争优势和劣势所在。相比粗粒度的分析,本文的方法更加准确、有效、全面地对商品评论中各个属性所含有的情感进行量化分析,更好地为消费者、商家以及政府相关部门的决策提供有效的支持。