用户评论与产品销售量的相关性研究

来源 :电力与能源系统学报·下旬刊 | 被引量 : 0次 | 上传用户:peipei713988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:通过LSTM模型和Word2Vec对数据进行预处理以及量化评论,可以获得客户对产品偏爱程度的相关信息。建立了视觉监控模型来及时监视客户的评论,通过聚类分析,来确定产品的评分预警点。研究结果发现:对于微波炉产品,评分、评论和帮助等级与产品评论数量有很大的相关性。对于吹风机、婴儿奶嘴、微波炉的评分预警点分别为1、2、2。
  关键词:LTSM;线性回归;SPSS;聚类分析
  文本的情感倾向性分析,即针对每一条文本,实现正向、中性和负向的三分类,以识别其情感倾向。以此为基础,去建立视觉监控模型,处理评分评定和评论文字情感倾向性问题。通过分析之前的数据来检测数据预警点。
  1 基于LSTM模型的数据处理
  1.1 数据处理流程
  首先,归纳具有相同product_parent类型的案例,即具有相同product_parent特征的案例总数,获取CNT_PP作为因变量。然后,使用LSTM长期和短期存储网络处理独立变量审阅标题和审阅主体中的现有文本。利用LSTM模型,训练了一个文本分类器,它可以识别三种情绪:积极,中立和消极。
  具体流程如下:
  (1)进行句子的特征提取。利用多维向量解决单词的多向散度。为了解决高维向量的变化范围,使用word2vec模型来拟合实际文本评估。
  (2)完成单词分类并转换为高维向量后,通过建立递归神经网络,将矩阵形式的输入编码转换为低维一维向量,同时保留最有用的信息。
  (3)经过上述处理后,评论文本被重新定义为否定/肯定评论,并对处理后的注释进行情感评分。(负分+正分=1),得分示例表1所示。
  (4)对三种产品的评估得分进行分级([0,0.2],(0.2,0.4],(0.4,0.6],(0.6,0.8],(0.8,1.0)),并计算频率。
  1.2 数据处理分析
  对自变量进行分类,计算平均值并将其视为一个。
  首先,将position_probs的值分为五个级别,每个级别的间隔为0.2。数字越大,position_probs的值越高。帮助等级的价值分为五个等级,每等级间隔为100,分别用数字表示。数值越大,帮助等级的数值越大。
  接下来,计算上述处理后的每个product_parent的评分评分,有用票数和positive_probs的平均值,并将其标准化。
  2 线性回归模型的建立和求解
  2.1 模型建立
  本次线性回归模型仅以微波炉产品为例,来分析产品的评分,评论和有用评分与产品受欢迎程度之间的相关性,使用线性回归模型解决了该问题。首先,建立线性回归方程:
  2.2 模型求解
  根据分析,R值大于90%,R平方和经调整后大于80%。在此分析中,D-W残留测试的值为2.212。参考Durbin Watson表并结合R的相关值,可以认为该回归模型的拟合效果非常好。通过分析,可以看出方差分析的显著值为0.00,小于标准值0.05,说明自变量Star_avg_01,positive_avg_01,Helpful_avg_01和因变量Cnt_pp之間具有显著的线性关系。同时,我们得到线性回归方程中的相关系数,α=1.807,β=-23.164,γ=337.313,θ=26.346。
  通过分析,残差的分布没有明显的规律性,表明变量之间没有自相关,因此可以直接使用回归模型。从以上分析可以看出,对于微波炉产品,评分,评论和帮助等级与产品评论数量有很大的相关性。
  3 检测模型的建立与求解
  3.1 模型准备
  (1)数据处理
  在评价文本分析的过程中,情感分析和量化也是基于LSTM模型而进行的,这里不再赘述。获得每个评估的情感分数后,将其记录为正值。
  (2)模型的基础
  我们的可视化模型侧重于评分和评论文字情感倾向性的数据测量。通过对先前数据的分析,我们可以得到数据预警点进行预警。我们的预警点是确定阈。当测得的数据低于预警点时,公司应注意持续关注,并采取一定措施,避免舆论失控等严重事故对产品销售的不利影响。
  接下来,我们将为三种产品(吹风机,微波炉和奶嘴)建立数据测量方法和相应的警告点。
  3.2 模型建立
  假设每个评论分布在接下来的十个评论中。换句话说,假设s评论的有效性仅在S+1到S+10评论中起作用。为了便于数据处理,最后的十个评论首先被删除,然后进行预测。
  (1)评分预警点的建立
  为了确定预警点,首先选择每个评论文本的评分(记录为评分)和此文本之后的10个评分的平均值(记录为影响评分),然后对这些数据进行无监督的聚类处理。
  完成上述步骤后,我们将使用它们的真实数据对三个产品进行建模,并获得数据的聚类结果。
  将十个评论之后的每个评论平均值的评分评定值导入SPSS中,以进行KNN无监督聚类分析。分析之后,可获得以下两个聚类中心:(5,4.1)和(2,3.8)。将这个聚类结果与日常生活相联系,可以将2和5作为警告点,分别表示评分的低级警告点和评分的高级警告点。对于微波炉来说,通过相同的分析步骤以及在相同的聚类分析操作之后,两个聚类中心分别为(4,3.7)和(1,3.3)。将两个值分别作为高级别警告点和低级别警告点。对于婴儿奶嘴来说,两个聚类中心分别为(4.8,4.3)和(2.0,4.3)。将两个值分别作为高级别警告点和低级别警告点。
  (2)文本评论预警点的建立
  为了确定预警点,在此选择了每个文本注释的情感极值(记录为评分)和此文本后的10个评分情感极值的平均值(记录为影响等级),并选择了这些数据由无监督的群集处理。   因此,评论通常具有三个区别:正面,负面和中立。因此,在处理该实验时,我们选择将实验数据汇总为三类。
  在KNN无监督聚类分析之后,吹风机的相关数据可以获得三个聚类中心:(0.93,0.83)(0.66,0.77)(0.35,0.55)。在这里,将0.93和0.35视为高警告点和低警告点。对于微波炉,我们采用相同的分析方法,在KNN无监督聚类分析之后,可以获得三个聚类中心,分别为(0.91,0.83)(0.58,0.73)(0.00,0.002)。在此,将0.91和0.00分别视为高警告点和低警告点。对于婴儿奶嘴,三个聚类中心分别为(0.93,0.88)(0.66,0.76)(0.38,0.72)。在这里,将0.93和0.38视为高警告点和低警告点。
  3.3 建模结果
  通过聚类分析模型对上述数据进行处理后,可以建立基于评分和舆论分析的实时检测模型。
  实时监控模型的机制是检测评分和情绪极性的当前趋势,并以视觉形式显示出来,以便及时监控购物评价,实现评论文本的高频有效词汇云显示。在视觉检测系统中,我们使用正面和负面的词云来显示评论文本,并检测负面/正面/中性评论的数量和舆论的总体变化趋势,实时销售和其他参数作为数据测量手段,向制造商提供信息。圖1是一个示例(以吹风机的销售为例,并假设时间是最后一次售出吹风机)。
  4 总结
  本文通过LSTM模型实现了用户评价文本的三种分类和量化,并以此为基础,建立了关于评分、评论和有用评分与产品受欢迎程度之间的线性回归模型,证明了产品的销量与其评分、评论和有用评分有很强的相关性。
  在量化评论的基础上,本文提出了可视化检测模型,通过聚类分析,求得了三种产品的预警点;通过对吹风机的模拟来看,也取得了很好的效果。
  参考文献:
  [1] 王坤亮. 汉语情感倾向自动分类方法的研究[J]. 软件, 2013, 34(11): 73-76.
  [2] 姚天昉, 程希文, 徐飞玉, 等. 文本意见挖掘综述[J]. 中文信息学报, 2008, 22(3): 71-80.
  作者简介:李跃武(1999-10),汉,男,山东聊城,本科在读,研究方向:用户评论与产品销售量的相关性研究。
其他文献
摘要:伴随着近些年来我国经济的快速发展,电气也在人们的生活着扮演着重要的角色。但是在日常的用电中,我们需要格外注意对于用电安全隐患的排除工作,并且在此过程中,也出现了很多的问题需要得到解决,例如违章用电以及窃电行为的发生。相关的电力企业以及部门应根据呈现出来的发展趋势去了解现有的用电检查管理机制是否满足人们的实际需求,在此基础上不断地完善现有的不足之处。同时,展开相应的用电检查工作也显得格外重要,
期刊
摘要:重型机械产品装配需设计人员合理设计各个装配环节,按照装配技术要求,设计好图纸,注重满足客户合理的特殊要求,完善装配设计。但是,在重型机械产品装配过程中,工艺设计较复杂,且专业性突出,稍有不当就可能引发严重问题。故提出对相应装配工艺设计的研究,找到重型机械产品装配设计的理想技术路线。  关键词:重型机械;产品;装配;工艺设计;方式  重型机械产品其自身功能强大,且构件尺寸大、装配时不易移动,故
期刊
摘要:近年来教育体制的改革,教育方式也在不断深化改革。“模拟电子技术”是电子信息、计算机和自动化等工科专业的基础课,是一门公认的比较难学的课程。它的难主要体现在两方面:一是学生在理论学习时觉得知识点多,杂,难以理解;二是学生动手实践时,不知从何入手,不能将理论知识运用起来。学生学完课程,通过了考试,很快就忘记了大部分所学内容,没有真正弄明白知识的用途,更谈不上进行实际的电路设计。本文就模拟电路实训
期刊
摘要:改革开放以来,随着我国社会经济的高速发展,配电网建设日新月异,规模不断发展,技术也在更新换代。时代在进步,人民生活与社会生产对配电网建设提出了更高的要求。我们无时无刻不在享受着配电网发展对生活生产带来的便捷,同时也应该关注到自然灾害或人为因素造成大面积配电网事故的情况越来越多,这些事故影响着国民生活的幸福指数和社会经济的发展进程。  关键词:配电网;配电线路;发展方向  引言  随着社会经济
期刊
摘要:目前对于测试线的收纳和存放均无系统,一般是通过人工收纳,因此經常出现测试线混乱无章、杂乱捆绑等情况,不仅耗费大量整理时间,影响工作效率,同时容易造成线缆损坏,带来经济损失。本文研制一种新型断路器机械特性仪线捆电动收纳箱,能够有效的解决上述问题。  关键词:机械特性仪、电动收纳箱  引言  随着电力系统全国性的高速发展,电网设备的数量与日俱增,对应的各类工作也不断增加。电气试验作为判断电气设备
期刊
摘要:随着经济的发展,我国的电力行业的发展也有了改善。电力资源是当前我国生产和发展用电重要基础,同时也是当前大众生产生活的基本保障。近几年来电力系统逐渐成为我国比较重要的资源,所以,眼下国家对于电力电价的有效管理可以很大程度上提升资源的使用率,更好的为电力资源的有效调控做出相应的保证。在优化营商环境下,对电力市场内部的发展给予相应的重视可以进一步促进电力市场的可持续发展,本文主要针对优化营商环境下
期刊
摘要:近年来,电力工程发展日新月异。数据网络在电力系统中应用日益广泛,信息技术发展迅猛。电力信息技术不断的提升,提高了电力生产的效率,促进了电力行业的发展。但海量信息数据的传输,使电力网络在使用过程中潜在着诸多不安全因素,如果网络的安全性得不到保障,将导致系统和软件的漏洞被不法分子所利用。日益严重的来自网络的安全威胁,对电力系统信息通信网络安全提出了新的要求,要求加强电力系统信息通信网络安全的防护
期刊
摘要:近年来,科学技术发展速度显著加快,35kV变电站综合自动化系统的应用愈加广泛,作为验收工作人员应具备较高的验收调试技术以及丰富的运行经验。在系统现场调试与日常运维中,应合理选择调试手段,以全面优化综合自动化系统。基于此,文章将35kV变电站综合自动化系统作为主要研究对象,重点阐述其结构与调试的相关内容,希望有所帮助。  关键词:35kV变电站;综合自动化系统;结构;调试  伴随电力设备的推广
期刊
摘要:我国所拥有的配电系统规划建设以及配电网在实际运行过程中所面临的问题、即将面临的问题。力求通过多种方式在我国电力企业建立起一套健全完善的智能配电网系统,增强电力企业的配电能力。同传统的配电网规划及其运行思路相比,智能配电网技术规划与运行思路具有更好的发展前景,同时代的发展也相匹配,能够积极利用起供电部门所拥有的网络消纳新增负荷,积极带动一些负荷发展较为缓慢的成熟电网。在未来新一代电力企业将会以
期刊
摘要:依托良好的社会发展形势以及科学技术进步,现代社会使用的机电设备不断增多,技术性能更高,对机电安装质量也不断提出新要求。良好的项目管理对促进机电安装整体质量提升有重要意义,在此,就项目管理工作进行分析。  关键词:机电设备;安装工程;项目管理  引言:  机电工程是工程建设的重要项目,如果管理不到位,施工不科学,会影响整个工程质量。如今,工程质量是社会关注的焦点、是企业谋求发展的必备素质,也是
期刊