论文部分内容阅读
随着互联网的迅猛发展,电商平台由于其高效和便利性,促使人们的购物习惯也从线下转到了线上,据中国互联网信息中心发布的第47次《中国互联网发展状况统计报告》显示,截至2020年12月,我国网络购物用户规模达7.82亿,2020年网上零售额超过11.76万亿元。用户购物之后会留下评论,分析用户评论可以让商家了解用户对产品的情感倾向如喜欢或者不喜欢,以此了解产品的受欢迎程度,针对差评进一步分析原因来发现产品缺点,以便商家可以及时更改营销策略或改进产品质量来获取更多的收入。而频繁的交易行为让人们在购物的同时也留下了大量的用户评论,动辄数万条的评论让商家无法手动分析。为了从大量的用户评论中发掘有价值的信息,面向电商评论领域构建用户评论的情感分析平台是亟需解决的重要问题。面对上述问题,本文建立了基于半监督学习的电商评论情感分析平台,通过对相关技术的研究,完成的主要工作如下:(1)基于半监督学习的情感分析框架的构建:充分利用自动样本增强、主动学习、自训练算法的优势,将模拟退火算法应用在搜索样本增强策略上,提高整体的效率,大幅降低人工标注成本;(2)数据可视化分析:实现了关键词和情感极性的可视化分析,为商家提供可视化能力,更直观的支撑商家的产品决策,其中关键词可视化实现了改进的关键词提取算法CV-IDF,帮助商家发现产品缺陷,并通过关键词及时改进产品质量或更改营销策略;(3)Web平台搭建:目前面向电商领域用户评论的半监督情感分析方向,还缺少相应平台,本平台实现了用户管理、数据管理、情感分类、数据分析等功能,给商家提供一站式解决问题能力。