论文部分内容阅读
摘要:为了更好地理解评论和星级评价对在线产品销售的影响,本文综合运用数据科学方法建立了相应的模型,进一步完善了在线产品销售策略。
首先,我们处理数据,然后简化条件。缺失的值,重复的和无用的评论将在数据处理开始时删除。第二,我们将诸如vine和verify_purchase之类的数据转换为定量数字,并计算帮助等级。最后,使用自然语言处理(NLP)技术和情感分析将评论内容转换为介于[0,1]之间的定量数字。总和是文本的最终分数。对于问题1,将其分解为子问题,并逐步回答问题2,其解决方案如下:
制定规则:当评估得分排在前25%,而词云的重叠率排在最后25%(词云:三种词及其在评论中的出现频率;由NLP处理)时,可以判断该产品具有成功的可能性很高。相反,可以判断该产品有较大的故障概率。
关键词:审查数据挖掘;层次分析法;情绪分析;方差分析
一、假设
我们做一些假设来简化我们的模型。详情如下:
(一)没有零售商通过不诚实的手段来提高其产品数据的可信度。
(二)采用随机抽样以确保可以减少主观影响。
(三)所选样本可以代表总体特征,以确保更准确地描述种群。
二、内容
(一)定义
词云:一组单词及其出现的频率。成功词云:一组肯定词及其出现频率。失败词云:一组否定词及其出现频率。 SC的重叠率:ORSC =当前词云和SCC的重叠部分,当前词云FC:ORFC的重叠率:当前词云与FCC的重叠部分,当前词云
(二)评估模型
当产品符合以下任一条件时,我们将其视为成功或失败的可能性很高。 (1)成功条件:如果产品平均综合得分排名前25%,而评论内容与SC的重叠率则超过75%。 (2)故障情况:如果产品平均综合得分排名不低于25%,而同时评论内容与FC的重叠率超过75%。
婴儿奶嘴的SC和FC部分如下:
(三)结果分析
我们发现,评估标准与复审文本的词汇特性相结合比单个评估标准更加稳定和准确。
三、结论
在线评论,星级,有用度和产品销售之间的关系被综合分析如下:
(一)为了定义最大信息的度量,使用层次分析法(AHP)来研究综合产品评分,评论,星级评分和帮助评分之间的关??系。
(二)时间序列模型用于建立综合的时间得分模型,该模型可用于预测声誉的变化趋势。
我们已经获得了基于文本的度量和基于费率的度量的组合,以指示潜在的成功或失败产品。
(三)我们计算了特定星级评价的情感倾向与评价内容之间的关系。
(四)我们进行了特征词与星级评价之间的相关性分析。
参考文献:
[1] Saaty T L.层次分析法决策[J]。国际服务科学杂志,2008,1(1):83-98。
[2] Vincent T,Risser L,Ciuciu P.空间自适应混合建模用于fMRI时间序列分析[J]。 IEEE医学影像交易,2010,29(4):1059-1074。
[3] Pang B,Lee L.观点挖掘与情感分析[J]。信息检索的基础与趋势,2008,2(12):1-135。
[4] Feldstein M S.流动性偏好和投资组合选择理论中的均值方差分析[J]。经济研究评论,1969,36(1):5-12。
作者簡介:
王彤(1999-04-),男,天津人,本科学历,研究方向:自动化专业。
首先,我们处理数据,然后简化条件。缺失的值,重复的和无用的评论将在数据处理开始时删除。第二,我们将诸如vine和verify_purchase之类的数据转换为定量数字,并计算帮助等级。最后,使用自然语言处理(NLP)技术和情感分析将评论内容转换为介于[0,1]之间的定量数字。总和是文本的最终分数。对于问题1,将其分解为子问题,并逐步回答问题2,其解决方案如下:
制定规则:当评估得分排在前25%,而词云的重叠率排在最后25%(词云:三种词及其在评论中的出现频率;由NLP处理)时,可以判断该产品具有成功的可能性很高。相反,可以判断该产品有较大的故障概率。
关键词:审查数据挖掘;层次分析法;情绪分析;方差分析
一、假设
我们做一些假设来简化我们的模型。详情如下:
(一)没有零售商通过不诚实的手段来提高其产品数据的可信度。
(二)采用随机抽样以确保可以减少主观影响。
(三)所选样本可以代表总体特征,以确保更准确地描述种群。
二、内容
(一)定义
词云:一组单词及其出现的频率。成功词云:一组肯定词及其出现频率。失败词云:一组否定词及其出现频率。 SC的重叠率:ORSC =当前词云和SCC的重叠部分,当前词云FC:ORFC的重叠率:当前词云与FCC的重叠部分,当前词云
(二)评估模型
当产品符合以下任一条件时,我们将其视为成功或失败的可能性很高。 (1)成功条件:如果产品平均综合得分排名前25%,而评论内容与SC的重叠率则超过75%。 (2)故障情况:如果产品平均综合得分排名不低于25%,而同时评论内容与FC的重叠率超过75%。
婴儿奶嘴的SC和FC部分如下:
(三)结果分析
我们发现,评估标准与复审文本的词汇特性相结合比单个评估标准更加稳定和准确。
三、结论
在线评论,星级,有用度和产品销售之间的关系被综合分析如下:
(一)为了定义最大信息的度量,使用层次分析法(AHP)来研究综合产品评分,评论,星级评分和帮助评分之间的关??系。
(二)时间序列模型用于建立综合的时间得分模型,该模型可用于预测声誉的变化趋势。
我们已经获得了基于文本的度量和基于费率的度量的组合,以指示潜在的成功或失败产品。
(三)我们计算了特定星级评价的情感倾向与评价内容之间的关系。
(四)我们进行了特征词与星级评价之间的相关性分析。
参考文献:
[1] Saaty T L.层次分析法决策[J]。国际服务科学杂志,2008,1(1):83-98。
[2] Vincent T,Risser L,Ciuciu P.空间自适应混合建模用于fMRI时间序列分析[J]。 IEEE医学影像交易,2010,29(4):1059-1074。
[3] Pang B,Lee L.观点挖掘与情感分析[J]。信息检索的基础与趋势,2008,2(12):1-135。
[4] Feldstein M S.流动性偏好和投资组合选择理论中的均值方差分析[J]。经济研究评论,1969,36(1):5-12。
作者簡介:
王彤(1999-04-),男,天津人,本科学历,研究方向:自动化专业。