电子商务在线评论情感分类方法研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:dddddddaaaaaaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的迅速发展,各个电子商务平台都积累了海量的消费者在线评论数据,这些数据蕴藏着极高的商业价值,分析其内容对商家和消费者都具有重要意义,尤其是自动识别评论内容的褒贬性对其进行情感分类。然而在面对海量评论数据时,仅仅依靠人工处理已无法满足需要,这就使得评论文本内容自动分类技术变得十分重要。本研究将现有的文本分类技术运用到电子商务在线评论文本情感分类问题中,通过实验来对比各种分类方法在解决该问题上的优劣性。研究主要做了以下工作:首先利用网络爬虫技术采集真实的电子商务网站在线评论文本数据和评分数据,对数据做预处理后利用Word2vec工具建立词向量模型,以及建立针对电子商务在线评论文本分类任务的情感词典,并选择合适的特征提取方法进行特征提取,然后分别使用基于词典的分类方法,K近邻、决策树、朴素贝叶斯、支持向量机等基于机器学习的分类方法,以及卷积神经网络、长短期记忆模型等深度学习分类方法,对采集的在线客户评论文本数据进行分类,最后比较各种分类方法的准确率、召回率和F测度指标,从而对比分析各种分类方法的优缺点。实验结果表明,基于情感词典的方法从各指标上都明显不如其他方法,可见虽然该方法实施简单,但是分类效果却不尽人意,其对词典的质量具有非常大的依赖性。其次,基于机器学习的各方法之间分类效果差异比较大,决策树和K近邻方法表现不如朴素贝叶斯,支持向量机表现最好。而基于深度学习的两种方法属于三类方法中分类效果最好的一类,其中卷积神经网络是所有方法中表现最好的。另外,对于基于机器学习和深度学习的方法,词向量维度和特征选择方法对分类效果有很大的影响,本研究针对这两个因素设计不同实验进行对比,发现对于基于机器学习的方法用词向量均值做特征选择最佳,对于基于深度学习的方法用信息增益方法做特征选择最佳。
其他文献
针对末制导段采用直接碰撞动能杀伤技术的拦截弹拦截战术弹道导弹(TBM),分析了导引头分辨率、帧频和测量噪声等主要性能参数对制导精度的影响。在拦截弹弹道修正和姿态控制规
高效三相分离器是目前原油处理系统中应用最为先进的处理装置,在生产应用中暴露出的问题得到合理解决后,各项生产技术指标均能达到设计要求,具有较好的推广应用前景。
随着我国经济社会的不断发展,电力工程企业也得到了飞速的发展。下面本就电力工程为核心,对其现阶段的现状和问题进行分析,然后总结出电力工程项目施工阶段进度与成本联合控
游客、居民和旅游从业人员是旅游发展的主要参与者,其对旅游发展的感知,直接反映旅游发展的品质与趋势。对张家界游客、居民及从业人员旅游发展感知调研显示:国内游客的满意
本研究通过2×2混合实验设计,考察了不同性别的被试在再认与偏好测验中对有关攻击性的图片所表现出的多种异同,得出结论:1.不同性别对内隐和外显社会认知有着不同影响,即出现了实验性
为观察内镜消毒机及其配套的固体过氧乙酸对微生物的杀灭效果,采用载体浸泡定量法和模拟现场试验对其消毒效果进行了观察。结果,以含58.95mg/L过氧乙酸和386.30mg/L过氧化氢的固体
非营利组织的健康发展在构建和谐社会中起着重要的作用,但财务治理缺失和财务信息披露问题已经阻碍了非营利组织的正常发展。本文对上海市浦东新区部分非营利组织进行了一次
实际作战过程中时间窗(time window)属性是作战任务具有的一类重要属性.结合作战计划的制定过程,阐明了作战计划所固有的层次性.以及各指挥层次中任务与计划的关系:以多兵种
化工装置有很多管道和设备需要依靠伴热的方法来维持介质的温度,蒸汽外伴热管伴热是广泛采用的一种伴热方式,但是很多化工企业对于蒸汽外伴热管伴热的设计计算没有一个系统的