论文部分内容阅读
最近几年,互联网发展迅猛,无论从互联网规模还是内容渗透均取得了长足发展,诸如电子商务、社交网络等互联网应用已经成为了最快速的增长领域。而运作在互联网平台上的零售商业和网络社交与线下的传统方式具有非常大的差异。互联网的开放特性使得用户的行为特征已经与线下行为的规律具有巨大差异,因此传统的行为研究方法就已经难以用来研究互联网上的用户规律。对最主要的三大网络用户行为网络购物、网络社交、网络信息分享的数据分析发现,网络用户行为较之传统线下用户行为具有明显的属性聚集现象即用户行为的偏好。本文根据网络用户行为的偏好的几个表现方面,通过对论坛用户参与热点话题的数据、微博热门消息传播数据和淘宝网商品交易数据分别在用户情感、用户属性、话题属性、商品推荐属性、信用属性等多个数据集的不同属性上进行聚集分析、数据抽象处理和属性偏好的可视化。在对论坛数据处理中,本文采用了文本分析模型,建立了情感分析词典的用户情感分析模型,结合用户参与的宏观情况与用户属性建立了时变状态下的星盘模型,可以有效显示用户群体和个体在不同属性上的偏好情况;在微博数据中,采用星盘模型对用户评论与转发进行了宏观属性的偏向可视化,显示了VIP用户在微博舆论中的引导作用;在淘宝网商品数据中,针对商品评价、商家信用和商品相关性建立了商品推荐模型,显示了用户可能偏向的三种属性与商品分布的情况和规律,可视显示考虑偏好的商品推荐。本文主要通过三种数据进行不同类别的偏好属性分别进行可视化模型的建立,提出了从全新角度进行互联网用户行为数据可视化的新思路。这种方法考虑因用户本身潜在因素可能造成的一些用户偏好,避免了传统方法中忽略这一方面影响而造成的分析误差。