论文部分内容阅读
如今电子商务交易平台发展迅猛,繁荣蓬勃的背后离不开物流体系的支撑作用。然而,交易平台以弥补线上购物感知性不足为初衷设立的在线评论功能,却无法有效避免虚假评论的涌现。虚假评论将直接导致物流体系因刷空包、误导性购买而产生的不必要的运输成本及人力物力的消耗。当前物流行业与电子商务交易平台已形成一荣俱荣、一损俱损的依存关系,因此,如何检测出物流前端交易平台的虚假评论对降低物流业成本、规范整个电子商务市场都有重大意义。为保证结果的可应用性,研究使用网络爬虫采集了交易平台的真实数据并进行相应的预处理工作。电子商务交易平台倾向于展现个性化的评论行为与共性化的购买行为,而购买与评价行为本身是连贯的。因此在研读其他学者的相关文献后,研究首先划分四种产品类型,并分别展示连续日期下该类型产品的消费者的购买与评价行为。结合消费者购买与评价行为时间差,研究通过各个维度的分析确定了可疑虚假评价团体。随后,研究对评论内容进行文本分析,包括构建情感词典、应用分词技术、应用Apriori算法提取文本主题、构建文本特征向量以及计算文本相似度等。最后,研究结合消费者行为的数据分析与消费者评论的文本分析、辅以K-means算法提出了对虚假评价的检测方法,研究可应用于评论数据采集与可信度自动化识别,具备良好的检测效率与效果。