论文部分内容阅读
随着互联网的快速发展,在线评论的数量以指数级增长。在线评论是消费者对其购买的商品或服务的评价,对潜在消费者做出购买决策具有极大的参考价值。但在线评论的参考价值参差不齐,在线评论有用性则度量了在线评论对消费者购买商品或服务的参考价值,分析在线评论有用性有助于帮助消费者快速做出购买决策。然而,目前在线评论的数量巨大,消费者难以便捷地找到有用性高的在线评论;并且当前主流的电商网站(如亚马逊、淘宝等),主要依靠在线评论的评级或发表时间对在线评论排序,但这些排序方式相对简单,难以有效地帮助消费者进行购买决策。因此,如何从海量的在线评论中发现有价值的评论是一项巨大挑战。为了从大量的在线评论中提取出有用性高的在线评论,本文从用户对在线评论有用性的影响角度出发,分析在线评论有用性。在电商网站的评论系统中,用户扮演两种角色——作者和投票者,本文通过分析作者发表评论和投票者为评论投票的两种行为,发现用户是影响在线评论有用性的关键因素。本文构建了社交评论图模型描述用户与在线评论之间的影响关系,并分析了用户质量对在线评论有用性产生的影响。该图模型包含用户和评论两种节点,构建了三种类型的边:用户-评论边、用户-用户边和评论-评论边,用以描述用户与评论之间、不同用户之间和不同评论之间的影响关系,进而建立了用户关系矩阵和评论关系矩阵对用户质量和在线评论有用性进行建模,并通过关系矩阵的状态转移公式进行迭代计算,得到基于社交评论图的在线评论有用性。在社交评论图模型的基础上,本文提出了在线评论有用性融合排序模型。该模型将社交评论图模型与文本分析相融合对在线评论有用性进行分析计算,并根据在线评论有用性对在线评论进行排序。在线评论有用性从基于文本的在线评论有用性和基于社交评论图的在线评论有用性两个方面度量。基于文本的在线评论有用性通过将商品属性关键词计算和评论文本相似度分析相结合进行计算,进而通过加权计算的方式将基于文本的在线评论有用性和基于社交评论图的在线评论有用性相结合,计算得到在线评论有用性,并据此对在线评论进行排序。本文以亚马逊电商平台的商品评论为实验评估对象,采用了三个真实的在线评论数据集,包括一个公开的亚马逊衣物评论数据集、两个爬取自亚马逊的移动电源和图书评论数据集,对社交评论图模型和在线评论有用性融合排序方法进行实验分析和评估。本文对社交评论图模型的性能进行评估,结果表明用户质量对在线评论有用性具有正相关的影响作用,并展示了社交评论图模型对于分析在线评论有用性的有效性;在线评论有用性融合排序方法将人工排序结果作为真值,与亚马逊top rated排序方法、基于复杂网络的评论有用性分析方法等其他流行算法在准确率指标上进行比较,结果表明相比于传统的排序方法,本文提出的融合排序方法具有较高的准确率。