论文部分内容阅读
近年来快速发展的互联网促使了线上购物商城的兴起,许多用户选择在网上购买商品,而购物评论也逐渐成为了主要的信息发布渠道。用户在参考过往评论后决定是否购买,而在消费后用户也会写下评论来表达意见。因此,针对购物商城网上评论的情感倾向分析已成为当前相关领域的一个重要研究内容。通过对各领域的商品评论进行情感倾向分析可以帮助商家和用户准确了解商品的优缺点等情况,为商家改进服务质量和制定营销策略、为用户按需求购买商品提供有力的参考依据。然而由于购物评论数据的数量庞大,用户难以直接获得有用的情感信息。因此本文采取语义知识中基于情感词典的购物评论情感倾向分析方法,对评论文本的情感分析问题展开研究讨论,并通过实验验证本文方法能够达到提高情感分析准确率的效果。本论文的主要工作内容有:(1)对比分析了情感分类领域中常用的关键技术,总结了目前研究中使用的分词、特征提取等方法的优劣势。同时对本文所用到的研究理论、数学表达式及其特点作简要介绍,为后续研究工作奠定了基础。(2)对评论文本预处理并去除停用词,减少噪音对情感分类结果造成的影响。针对各领域购物评论中存在的用词差异以及在表达情感时有所区别的情况,提出了基于PTF-IDF方法构建领域情感词典,取得更多有效情感特征。(3)考虑了网络用语、表情符号等因素对评论情感倾向的影响程度。对中文句法中具有修饰作用的程度词语、否定词语以及双重否定词语等作相应处理。为了进一步分析各领域购物评论的情感类别,提出了Field-PMI方法衡量领域情感词语与评论之间的相关性。经实验结果表明本文方法能有效提高购物评论情感倾向的分类准确性。