论文部分内容阅读
[摘 要] 在线评论的投票数反映了阅读者对该条评论的关注度,对潜在消费者的购物决策具有很大的参考价值。本文以京东商城热门手机的在线评论为研究对象,结合文本挖掘技术和实证研究方法,从数字特征、写作风格和语义3个维度研究在线评论投票数的影响因素。研究表明:评论中优点和不足内容是否相同对投票数有显著的正向影响,评论正文的主观性对投票数有显著的负向影响。此外,产品故障词、产品特征词和情感程度词对投票数也有重要影响。
[关键词] 电子商务; 在线评论; 投票数; 文本挖掘; 语义
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 17. 050
[中图分类号] F713.36 [文献标识码] A [文章编号] 1673 - 0194(2012)17- 0088- 04
1 引 言
在线评论被认为是传统口碑的数字化表现形式[1],承载了消费者的直接产品体验,蕴含了大量的管理和决策支持信息。其价值可以从买方和卖方两方面来分析:
(1) 买方价值:在线评论属于一种无偏产品信息,其可信度大大高于商家的促销信息,对潜在客户的购买决策具有重要影响[2]。
(2) 卖方价值:厂商可以通过对用户发表的在线评论的研究,来發现用户对本企业产品的满意程度,本产品与同类产品相比的优势和劣势,据此对产品进行改进,从而增强企业竞争力。
然而,随着在线评论的不断增加,在线评论也出现了信息爆炸时代的普遍问题——信息过载[3-4]。在线评论数量的巨大和质量的参差不齐严重干扰了评论阅读者对产品质量的有效判断,增加了信息搜寻成本,降低了决策的效率[5]。因此,有效地识别在线评论的价值就显得至关重要。
许多电子商务网站会鼓励阅读者对自己看到的在线评论进行投票,然后利用投票数来评价一条评论的有用性。本文在现有研究的基础上,构建在线评论投票数的影响因素模型。本文的研究目的是更好地解释为什么有的评论会得到较多的投票数,而有的评论只得到很少的投票数。
本文收集了中国最大的电子产品交易网站——京东商城热门手机的在线评论信息,结合文本挖掘技术和实证研究方法,从数字特征、写作风格和语义3个维度来研究在线评论投票数的影响因素、作用方向和重要程度。本文内容组织如下:第2节,根据相关理论和文献研究提出理论假设,建立在线评论投票数的影响因素模型。第3节,阐述数据采集、处理和实证分析的过程,并对分析结果进行分析和解释。第4节,给出研究结论及其意义,并指出研究局限和后续研究方向。
2 模型与理论假设
在之前研究的基础上,本文构建的在线评论投票数影响因素模型如图1所示。
2.1 数字特征维度
数字特征指的是不涉及文本内容的信息,包括:① 产品的平均得分,记为AvgScore。② 评论者评分,记为Rating。③ 评论发表距今的时间间隔,记为ElapsedDay。④ 评论者是否填写了产品的不足,记为NoDisadv。
文献[6]研究表明评论者是否填写了产品的不足对投票数没有显著影响,这与之前的研究略有出入。消费者通常会认为负面信息比正面信息更具诊断价值,因而在做购买决策时更多地依赖负面信息[5] ,而产品的不足反映的正是其负面信息,由此,本文提出假设H1。
H1:评论者是否填写了产品的不足对投票数有显著的正向影响。
2.2 写作风格维度
写作风格反映了评论人写作的特点。写作风格主要体现在正文各部分内容(优点、不足和使用心得)是否相同,文本长度,平均句长和评论的主观性等方面。
评论可以分为标题和正文。标题通常比较短,评论者的写作风格主要体现在正文里,所以本文中写作风格主要指的是正文风格。写作风格包括:① 正文各部分内容(优点、不足和使用心得)是否相同,记为Same。② 文本长度。评论分为标题和正文两部分,标题长度记为TitLen,正文长度记为ConLen。本文将长度作为文本信息量的一个度量指标。③ 平均句长,记为AvgLen。④ 评论的主观性,记为Sub。本文把评论中形容词所占比重作为评论主观性的代理指标。
正文各部分内容(即优点、不足和使用心得)是否相同以及评论的主观性是本文新加入模型的影响因素。
评论者在优点、不足和使用心得中填写相同的内容,可能的原因是:用重复来强调自己满意或者不满意的强烈情感;发表评论仅为了获得网站的积分,复制粘贴可以节约时间。基于以上的分析,并不能断定正文各部分内容是否相同对投票数的影响是正向还是负向。正文分为优点、不足和使用心得3部分,通常来讲,优点是对产品的正面评价,不足是对产品的负面评价,使用心得是对产品的总体评价,表达正面情感或者负面情感均可。若优点和不足填写了相同的内容,评论者可能是想通过这种重复来强调自己的某种情感(满意或者不满意),那么它对投票数有正向影响;若使用心得和优点或者是不足内容相同,这样就会减少评论的信息量,可能会对投票数有负向影响。由此,本文提出假设H2。
H2:正文各部分内容是否相同对投票数有影响,但不确定是正向还是负向。
H2a:评论优点和不足内容是否相同对投票数有显著的正向影响。
H2b:评论优点和使用心得内容是否相同对投票数有显著的负向影响。
H2c:评论不足和使用心得内容是否相同对投票数有显著的负向影响。
文献[7]把评论文本内容分为客观和主观两类。文献[8]研究了文本的主观性对在线评论有用性的影响,结果发现,评论的主观性越大,评论的有用性越低。由此,本文提出假设H3。
H3:评论的主观性对评论的投票数有显著的负向影响。
2.3 语义维度
文献[6]研究表明语义是影响投票数的重要因素,但是并没有深入研究每一个词语对投票数的影响,且由于采用了因子分析的方法,实验结果比较难以解释。挖掘重要产品特征和判断评论观点的情感倾向是在线评论挖掘的两个很重要的方面[9],所以本文假设产品特征和观点的强烈程度对投票数有显著影响。文献[5,10]都直接把评论者评分作为评论者情感倾向的代理指标,并未从语义的角度来考虑情感倾向及其程度,所以本文将通过情感程度词来展现评论者情感强烈程度。本文扩展了原模型中语义对投票数的影响,从产品特征词(记为Feature)、产品故障词(记为Breakdown)和情感程度词(记为SenDe) 3方面来研究语义对投票数的影响。 评论中体现的产品特征越多,评论就可能得到越多的投票数;评论者的情感越强烈,评论就可能得到越多的投票数。由此,本文提出假设H4、H5、H6。
H4:产品特征词对评论的投票数有显著的正向影响。
H5:产品故障词对评论的投票数有显著的正向影响。
H6:情感程度词对评论的投票数有显著的正向影响。
2.4 回归方程模型
根据以上假设,建立在线评论投票数影响因素模型,见公式(1)。
Votes = α + β1 × AvgScore + β2 × Rating + β3 × ElapsedDay + β4 × NoDisadv + β5 × Same + β6 × RitLen + β7 × ConLen + β8 × AvgLen + β9 × Sub + β10 × Feature + β11 × Breakdown + β12 × SenDe + ε (1)
在公式(1)中,α是常量,ε是随机变量,即没有被模型解释的信息。需要说明的是,公式中的β5,β10,β11,β12 以及Same,Feature,Breakdown和SenDe都是向量,而不是单个的变量。Same = (Same 1,Same 2,Same 3),是三元变量,Same 1指的是优点和不足内容是否相同,Same 2指的是优点和使用心得内容是否相同,Same 3指的是不足和使用心得内容是否相同。Feature,Breakdown和SenDe则要根据具体操作过程中选定的产品特征词、产品故障词和情感程度词的个数而定。
3 实证研究
3.1 数据采集
本文的实验数据来源于京东商城(www.360buy.com)。京东商城是中国最大的电子类产品交易网站,网站上汇集了大量的在线评论。本文抓取了京东商城上热门的31款手机的评论数据,涵盖了诺基亚、苹果、摩托罗拉、三星、金立等众多的国内外品牌。
在对2 127条评论的投票数中,最多的是147票,最少的是0票,随着投票数的增多,评论数量在减少,尤其是当投票数超过15时,评论数量急剧减少,所以本文将投票数大于等于15票的评论归并为一组,投票數统一记作15。表1展示了评论投票数的分布情况。
按照京东商城的规定,在线评论的评分、标题、优点、不足和使用心得都是必填项,不过产品缺点排在了最后一行,且设置有默认值“暂时还没有发现缺点哦!”。本文认为若在线评论的缺点采用了京东商城的默认值,则可以认定为评论人没有填写产品的不足,用0表示;若评论者填写了产品的不足,则用1表示。
3.2 数据处理过程
数据处理过程如图2所示:① 评论筛选,剔除质量较差的评论,如标题中只有符号没有文字的评论。② 数据预处理,可以直接获得一些变量的值。③ 构建自定义词库。在线手机评论中包含一些手机专有词汇和一些不太规范的网络用语,而这些词语是不包含在分词软件的自有词库中的(如性价比,花屏,坑爹,给力等),所以需要将这些词加入自定义词库中。此外,由于后面研究语义特征对投票数影响时考虑了情感程度词,所以需要将情感程度词也加入自定义词库中。本文采取人工定义的方法,从手机参数和产品评论中选取了111个手机特征词,46个手机故障词和10个网络常用词。情感程度词采用的是中国知网发布的知网情感词汇(beta版)中程度级别词语(中文)所列出的216个程度词。④ 分词并标注词性。本文采用中国科学院计算机所软件室编写的中文分词工具ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)对评论文本语料进行分词。
3.3 实验过程及其结果分析
本文采用线性回归中的逐步回归法来研究在线评论投票的影响因素。逐步回归法是一种常用的消除多重共线性、选取“最优”回归方程的方法。本文提出的众多变量之间可能存在共线性,运用逐步回归法可以有效地消除共线性,选出影响投票数的关键因素,所以本文的实验方法选用逐步回归法。
本文提出模型的整体拟合度以及标准化参数估计结果见表2。为检验本文模型的拟合效果是否有所提高,采用本文使用的评论数据对文献[6]提出的模型进行拟合,对照比较两者的估计结果(说明:因为语义维度包含较多的词语,所以表2中未列出其回归系数)。
对于本文提出的假设模型,F检验显著,表明模型线性回归关系成立,总体拟合指标——调整R2为0.365,而利用本文的手机评论数据拟合文献[6]中的模型,其调整R2为0.322。在加入本文新提出的几个因素之后,模型的总体拟合度从0.322提高到了0.365,提高了13.35%,效果显著,说明本文模型对在线评论投票数的总体解释力明显好于文献[6]的研究模型。本文模型的回归结果对前述假设的支持情况见表3。
从本文模型的回归结果中,可以得出以下结论:
(1) 对评论投票数影响最大的是平均得分和评论者评分,且回归系数都为负。若一个手机的平均得分较低,那么针对它的评论就可能得到更多的投票数,若一条评论的评论者评分较低,则该条评论就可能得到更多的投票。这与之前文献的结论一致:消费者通常会认为负面信息比正面信息更具诊断价值,因而在购买决策时更多地依赖负面信息[5] 。
(2) 优点和不足内容是否相同对评论投票数有正向影响。若评论中的优点和不足内容相同,则该条评论就可能得到更多的投票数。可能的解释是:通常意义上,优点应该是评论者对产品的赞美,包含正向情感,不足应该是评论者对产品的不满,包含负向情感。若优点和不足内容相同,很可能评论者是想通过这种重复的方式来表达自己某种强烈的情感。
(3) 正文中形容词比例对投票数有负向影响,即评论正文中形容词比例越低,则该条评论就可能得到更多的投票数。对于电子类产品,比较客观的评论容易吸引阅读者的投票。 (4) 手机故障词对投票数有正向影响。可能的解释是:如果评论正文中出现了这些手机故障词,通常都表达了评论者对手机的负向情感,较易吸引阅读者的投票。对投票数有显著影响的手机故障词有:退货,换货,假货,掉漆,黑屏,自动关机,二手货,划痕,花屏,高仿。
(5) 手机特征词和情感程度词对投票数的影响不定,有些词是正向影响,有些词是负向影响。可能的解释是:单独的手机特征词和情感程度词本身并不能表示出有用的信息,需要结合其前后的词语和所在的语境做更加深入的分析才能对其进行评价。对投票数有显著影响的手机特征词有:客服,手机,东西,机器,服务,信号,数据线,软件,音质,功能,按键,机子,商品,屏幕,后盖,价格,物流,机型,触屏,质保。对投票数有显著影响的情感程度词有:很,挺,极端,一点儿,这样,极其,不过,最。
(6) 正文长度和标题长度对投票数有正向影响,即标题越长,正文长度(优点、不足和使用心得的总长度)越长,则该条评论就可能得到越多的投票。可能的解释是:文本的长度从某种程度上反映了文本包含的信息量,阅读者浏览评论时倾向于信息量大的评论,这是容易理解的。
(7) 评论发表距今的时间对投票数有正向影响,即评论发表越早,该条评论就可能得到更多的投票数。
4 结束语
本文以京东商城上热门手机的在线评论为研究对象,结合文本挖掘技术和实证研究方法,从数字特征、写作风格和语义3个维度来研究众多的变量对在线评论投票数的影响。研究表明:产品的平均得分,评论者评分,正文长度,评论发表时间,优点和不足内容是否相同,标题长度,手机故障词等变量对评论投票数有较大影响。
较之于以前的研究,本文的主要贡献在于:① 研究了正文各部分内容是否相同对投票数的影响。研究结果表明优点和不足的内容相同对于投票数有较大影响,其重要程度甚至超过了评论标题长度对投票数的影响。② 研究了评论的主观性对投票数的影响。研究结果表明:评论的主观性对投票数有较大的负向影响。③ 研究了产品特征词、产品故障词和情感程度词对投票数的影响。本文的研究结论对于购物网站和评论者发表评论都具有现实的参考价值。
本文尚有一些不足有待改进:本文选取了京东商城的热门手机评论数据进行研究,文中结论对于其他类产品是否适用有待进一步的检验,这将是笔者未来研究的主要方向。
主要参考文献
[1] C Dellarocas. The Digitization of Word of Mouth: Promise and Challenges of Online Feedback Mechanisms[J]. Management Science,2003,49(10) :1407-1424.
[2] 金立印. 網络口碑信息对消费者购买决策的影响:一个实验研究[J]. 经济管理, 2007,29(22):36-42.
[3] E Brynjolfsson,M D Smith. Frictionless Commerce?A Comparison of Internet and Conventional Retailers[J]. Management Science,2000,46(4):563-585.
[4] Q Jones,G Ravid,S Rafaeli. Information Overload and the Message Dynamics of Online Interaction Spaces:A Theoretical Model and Empirical Exploration[J]. Information Systems Research,2004,15(2):194-210.
[5] 郝媛媛, 叶强, 李一军. 基于影评数据的在线评论有用性影响因素研究[J]. 管理科学学报,2010,13(8).
[6] Qing Cao, Wenjing Duan, Qiwei Gan. Exploring Determinants of Voting for the “Helpfulness” of Online User Reviews: A Text Mining Approach[J]. Decision Support Systems,2011,50(2):511-521.
[7] Pang B, Lee L. A Sentimental Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts [C]. Proceedings of the 42nd Annual Meeting of the Association for Computational Linguistics (ACL), Morristown, NJ, USA: Association for Computational Linguistics, 2004.
[8] Ghose A,Ipeirotis P G. Designing Novel Review Ranking Systems: Predicting the Usefulness and Impact of Reviews[C]. Proceedings of the 9th International Conference on Electronic Commerce,New York,NY,USA: Association Computing Machinery(ACM),2007:303-310.
[9] Anna-Maria Popescu,O Etzioni. Extracting Product Features and 0pinions from Reviews[C]. Proceedings 0f HIJ-EMNLP 2005,ACL,2005:339-346.
[10] M P O’Mahony,B Smyth. A Classification-Based Review Recommender[J]. Knowledge-Based Systems,2010,23(4):323-329.
[关键词] 电子商务; 在线评论; 投票数; 文本挖掘; 语义
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 17. 050
[中图分类号] F713.36 [文献标识码] A [文章编号] 1673 - 0194(2012)17- 0088- 04
1 引 言
在线评论被认为是传统口碑的数字化表现形式[1],承载了消费者的直接产品体验,蕴含了大量的管理和决策支持信息。其价值可以从买方和卖方两方面来分析:
(1) 买方价值:在线评论属于一种无偏产品信息,其可信度大大高于商家的促销信息,对潜在客户的购买决策具有重要影响[2]。
(2) 卖方价值:厂商可以通过对用户发表的在线评论的研究,来發现用户对本企业产品的满意程度,本产品与同类产品相比的优势和劣势,据此对产品进行改进,从而增强企业竞争力。
然而,随着在线评论的不断增加,在线评论也出现了信息爆炸时代的普遍问题——信息过载[3-4]。在线评论数量的巨大和质量的参差不齐严重干扰了评论阅读者对产品质量的有效判断,增加了信息搜寻成本,降低了决策的效率[5]。因此,有效地识别在线评论的价值就显得至关重要。
许多电子商务网站会鼓励阅读者对自己看到的在线评论进行投票,然后利用投票数来评价一条评论的有用性。本文在现有研究的基础上,构建在线评论投票数的影响因素模型。本文的研究目的是更好地解释为什么有的评论会得到较多的投票数,而有的评论只得到很少的投票数。
本文收集了中国最大的电子产品交易网站——京东商城热门手机的在线评论信息,结合文本挖掘技术和实证研究方法,从数字特征、写作风格和语义3个维度来研究在线评论投票数的影响因素、作用方向和重要程度。本文内容组织如下:第2节,根据相关理论和文献研究提出理论假设,建立在线评论投票数的影响因素模型。第3节,阐述数据采集、处理和实证分析的过程,并对分析结果进行分析和解释。第4节,给出研究结论及其意义,并指出研究局限和后续研究方向。
2 模型与理论假设
在之前研究的基础上,本文构建的在线评论投票数影响因素模型如图1所示。
2.1 数字特征维度
数字特征指的是不涉及文本内容的信息,包括:① 产品的平均得分,记为AvgScore。② 评论者评分,记为Rating。③ 评论发表距今的时间间隔,记为ElapsedDay。④ 评论者是否填写了产品的不足,记为NoDisadv。
文献[6]研究表明评论者是否填写了产品的不足对投票数没有显著影响,这与之前的研究略有出入。消费者通常会认为负面信息比正面信息更具诊断价值,因而在做购买决策时更多地依赖负面信息[5] ,而产品的不足反映的正是其负面信息,由此,本文提出假设H1。
H1:评论者是否填写了产品的不足对投票数有显著的正向影响。
2.2 写作风格维度
写作风格反映了评论人写作的特点。写作风格主要体现在正文各部分内容(优点、不足和使用心得)是否相同,文本长度,平均句长和评论的主观性等方面。
评论可以分为标题和正文。标题通常比较短,评论者的写作风格主要体现在正文里,所以本文中写作风格主要指的是正文风格。写作风格包括:① 正文各部分内容(优点、不足和使用心得)是否相同,记为Same。② 文本长度。评论分为标题和正文两部分,标题长度记为TitLen,正文长度记为ConLen。本文将长度作为文本信息量的一个度量指标。③ 平均句长,记为AvgLen。④ 评论的主观性,记为Sub。本文把评论中形容词所占比重作为评论主观性的代理指标。
正文各部分内容(即优点、不足和使用心得)是否相同以及评论的主观性是本文新加入模型的影响因素。
评论者在优点、不足和使用心得中填写相同的内容,可能的原因是:用重复来强调自己满意或者不满意的强烈情感;发表评论仅为了获得网站的积分,复制粘贴可以节约时间。基于以上的分析,并不能断定正文各部分内容是否相同对投票数的影响是正向还是负向。正文分为优点、不足和使用心得3部分,通常来讲,优点是对产品的正面评价,不足是对产品的负面评价,使用心得是对产品的总体评价,表达正面情感或者负面情感均可。若优点和不足填写了相同的内容,评论者可能是想通过这种重复来强调自己的某种情感(满意或者不满意),那么它对投票数有正向影响;若使用心得和优点或者是不足内容相同,这样就会减少评论的信息量,可能会对投票数有负向影响。由此,本文提出假设H2。
H2:正文各部分内容是否相同对投票数有影响,但不确定是正向还是负向。
H2a:评论优点和不足内容是否相同对投票数有显著的正向影响。
H2b:评论优点和使用心得内容是否相同对投票数有显著的负向影响。
H2c:评论不足和使用心得内容是否相同对投票数有显著的负向影响。
文献[7]把评论文本内容分为客观和主观两类。文献[8]研究了文本的主观性对在线评论有用性的影响,结果发现,评论的主观性越大,评论的有用性越低。由此,本文提出假设H3。
H3:评论的主观性对评论的投票数有显著的负向影响。
2.3 语义维度
文献[6]研究表明语义是影响投票数的重要因素,但是并没有深入研究每一个词语对投票数的影响,且由于采用了因子分析的方法,实验结果比较难以解释。挖掘重要产品特征和判断评论观点的情感倾向是在线评论挖掘的两个很重要的方面[9],所以本文假设产品特征和观点的强烈程度对投票数有显著影响。文献[5,10]都直接把评论者评分作为评论者情感倾向的代理指标,并未从语义的角度来考虑情感倾向及其程度,所以本文将通过情感程度词来展现评论者情感强烈程度。本文扩展了原模型中语义对投票数的影响,从产品特征词(记为Feature)、产品故障词(记为Breakdown)和情感程度词(记为SenDe) 3方面来研究语义对投票数的影响。 评论中体现的产品特征越多,评论就可能得到越多的投票数;评论者的情感越强烈,评论就可能得到越多的投票数。由此,本文提出假设H4、H5、H6。
H4:产品特征词对评论的投票数有显著的正向影响。
H5:产品故障词对评论的投票数有显著的正向影响。
H6:情感程度词对评论的投票数有显著的正向影响。
2.4 回归方程模型
根据以上假设,建立在线评论投票数影响因素模型,见公式(1)。
Votes = α + β1 × AvgScore + β2 × Rating + β3 × ElapsedDay + β4 × NoDisadv + β5 × Same + β6 × RitLen + β7 × ConLen + β8 × AvgLen + β9 × Sub + β10 × Feature + β11 × Breakdown + β12 × SenDe + ε (1)
在公式(1)中,α是常量,ε是随机变量,即没有被模型解释的信息。需要说明的是,公式中的β5,β10,β11,β12 以及Same,Feature,Breakdown和SenDe都是向量,而不是单个的变量。Same = (Same 1,Same 2,Same 3),是三元变量,Same 1指的是优点和不足内容是否相同,Same 2指的是优点和使用心得内容是否相同,Same 3指的是不足和使用心得内容是否相同。Feature,Breakdown和SenDe则要根据具体操作过程中选定的产品特征词、产品故障词和情感程度词的个数而定。
3 实证研究
3.1 数据采集
本文的实验数据来源于京东商城(www.360buy.com)。京东商城是中国最大的电子类产品交易网站,网站上汇集了大量的在线评论。本文抓取了京东商城上热门的31款手机的评论数据,涵盖了诺基亚、苹果、摩托罗拉、三星、金立等众多的国内外品牌。
在对2 127条评论的投票数中,最多的是147票,最少的是0票,随着投票数的增多,评论数量在减少,尤其是当投票数超过15时,评论数量急剧减少,所以本文将投票数大于等于15票的评论归并为一组,投票數统一记作15。表1展示了评论投票数的分布情况。
按照京东商城的规定,在线评论的评分、标题、优点、不足和使用心得都是必填项,不过产品缺点排在了最后一行,且设置有默认值“暂时还没有发现缺点哦!”。本文认为若在线评论的缺点采用了京东商城的默认值,则可以认定为评论人没有填写产品的不足,用0表示;若评论者填写了产品的不足,则用1表示。
3.2 数据处理过程
数据处理过程如图2所示:① 评论筛选,剔除质量较差的评论,如标题中只有符号没有文字的评论。② 数据预处理,可以直接获得一些变量的值。③ 构建自定义词库。在线手机评论中包含一些手机专有词汇和一些不太规范的网络用语,而这些词语是不包含在分词软件的自有词库中的(如性价比,花屏,坑爹,给力等),所以需要将这些词加入自定义词库中。此外,由于后面研究语义特征对投票数影响时考虑了情感程度词,所以需要将情感程度词也加入自定义词库中。本文采取人工定义的方法,从手机参数和产品评论中选取了111个手机特征词,46个手机故障词和10个网络常用词。情感程度词采用的是中国知网发布的知网情感词汇(beta版)中程度级别词语(中文)所列出的216个程度词。④ 分词并标注词性。本文采用中国科学院计算机所软件室编写的中文分词工具ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)对评论文本语料进行分词。
3.3 实验过程及其结果分析
本文采用线性回归中的逐步回归法来研究在线评论投票的影响因素。逐步回归法是一种常用的消除多重共线性、选取“最优”回归方程的方法。本文提出的众多变量之间可能存在共线性,运用逐步回归法可以有效地消除共线性,选出影响投票数的关键因素,所以本文的实验方法选用逐步回归法。
本文提出模型的整体拟合度以及标准化参数估计结果见表2。为检验本文模型的拟合效果是否有所提高,采用本文使用的评论数据对文献[6]提出的模型进行拟合,对照比较两者的估计结果(说明:因为语义维度包含较多的词语,所以表2中未列出其回归系数)。
对于本文提出的假设模型,F检验显著,表明模型线性回归关系成立,总体拟合指标——调整R2为0.365,而利用本文的手机评论数据拟合文献[6]中的模型,其调整R2为0.322。在加入本文新提出的几个因素之后,模型的总体拟合度从0.322提高到了0.365,提高了13.35%,效果显著,说明本文模型对在线评论投票数的总体解释力明显好于文献[6]的研究模型。本文模型的回归结果对前述假设的支持情况见表3。
从本文模型的回归结果中,可以得出以下结论:
(1) 对评论投票数影响最大的是平均得分和评论者评分,且回归系数都为负。若一个手机的平均得分较低,那么针对它的评论就可能得到更多的投票数,若一条评论的评论者评分较低,则该条评论就可能得到更多的投票。这与之前文献的结论一致:消费者通常会认为负面信息比正面信息更具诊断价值,因而在购买决策时更多地依赖负面信息[5] 。
(2) 优点和不足内容是否相同对评论投票数有正向影响。若评论中的优点和不足内容相同,则该条评论就可能得到更多的投票数。可能的解释是:通常意义上,优点应该是评论者对产品的赞美,包含正向情感,不足应该是评论者对产品的不满,包含负向情感。若优点和不足内容相同,很可能评论者是想通过这种重复的方式来表达自己某种强烈的情感。
(3) 正文中形容词比例对投票数有负向影响,即评论正文中形容词比例越低,则该条评论就可能得到更多的投票数。对于电子类产品,比较客观的评论容易吸引阅读者的投票。 (4) 手机故障词对投票数有正向影响。可能的解释是:如果评论正文中出现了这些手机故障词,通常都表达了评论者对手机的负向情感,较易吸引阅读者的投票。对投票数有显著影响的手机故障词有:退货,换货,假货,掉漆,黑屏,自动关机,二手货,划痕,花屏,高仿。
(5) 手机特征词和情感程度词对投票数的影响不定,有些词是正向影响,有些词是负向影响。可能的解释是:单独的手机特征词和情感程度词本身并不能表示出有用的信息,需要结合其前后的词语和所在的语境做更加深入的分析才能对其进行评价。对投票数有显著影响的手机特征词有:客服,手机,东西,机器,服务,信号,数据线,软件,音质,功能,按键,机子,商品,屏幕,后盖,价格,物流,机型,触屏,质保。对投票数有显著影响的情感程度词有:很,挺,极端,一点儿,这样,极其,不过,最。
(6) 正文长度和标题长度对投票数有正向影响,即标题越长,正文长度(优点、不足和使用心得的总长度)越长,则该条评论就可能得到越多的投票。可能的解释是:文本的长度从某种程度上反映了文本包含的信息量,阅读者浏览评论时倾向于信息量大的评论,这是容易理解的。
(7) 评论发表距今的时间对投票数有正向影响,即评论发表越早,该条评论就可能得到更多的投票数。
4 结束语
本文以京东商城上热门手机的在线评论为研究对象,结合文本挖掘技术和实证研究方法,从数字特征、写作风格和语义3个维度来研究众多的变量对在线评论投票数的影响。研究表明:产品的平均得分,评论者评分,正文长度,评论发表时间,优点和不足内容是否相同,标题长度,手机故障词等变量对评论投票数有较大影响。
较之于以前的研究,本文的主要贡献在于:① 研究了正文各部分内容是否相同对投票数的影响。研究结果表明优点和不足的内容相同对于投票数有较大影响,其重要程度甚至超过了评论标题长度对投票数的影响。② 研究了评论的主观性对投票数的影响。研究结果表明:评论的主观性对投票数有较大的负向影响。③ 研究了产品特征词、产品故障词和情感程度词对投票数的影响。本文的研究结论对于购物网站和评论者发表评论都具有现实的参考价值。
本文尚有一些不足有待改进:本文选取了京东商城的热门手机评论数据进行研究,文中结论对于其他类产品是否适用有待进一步的检验,这将是笔者未来研究的主要方向。
主要参考文献
[1] C Dellarocas. The Digitization of Word of Mouth: Promise and Challenges of Online Feedback Mechanisms[J]. Management Science,2003,49(10) :1407-1424.
[2] 金立印. 網络口碑信息对消费者购买决策的影响:一个实验研究[J]. 经济管理, 2007,29(22):36-42.
[3] E Brynjolfsson,M D Smith. Frictionless Commerce?A Comparison of Internet and Conventional Retailers[J]. Management Science,2000,46(4):563-585.
[4] Q Jones,G Ravid,S Rafaeli. Information Overload and the Message Dynamics of Online Interaction Spaces:A Theoretical Model and Empirical Exploration[J]. Information Systems Research,2004,15(2):194-210.
[5] 郝媛媛, 叶强, 李一军. 基于影评数据的在线评论有用性影响因素研究[J]. 管理科学学报,2010,13(8).
[6] Qing Cao, Wenjing Duan, Qiwei Gan. Exploring Determinants of Voting for the “Helpfulness” of Online User Reviews: A Text Mining Approach[J]. Decision Support Systems,2011,50(2):511-521.
[7] Pang B, Lee L. A Sentimental Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts [C]. Proceedings of the 42nd Annual Meeting of the Association for Computational Linguistics (ACL), Morristown, NJ, USA: Association for Computational Linguistics, 2004.
[8] Ghose A,Ipeirotis P G. Designing Novel Review Ranking Systems: Predicting the Usefulness and Impact of Reviews[C]. Proceedings of the 9th International Conference on Electronic Commerce,New York,NY,USA: Association Computing Machinery(ACM),2007:303-310.
[9] Anna-Maria Popescu,O Etzioni. Extracting Product Features and 0pinions from Reviews[C]. Proceedings 0f HIJ-EMNLP 2005,ACL,2005:339-346.
[10] M P O’Mahony,B Smyth. A Classification-Based Review Recommender[J]. Knowledge-Based Systems,2010,23(4):323-329.