论文部分内容阅读
用户画像技术是根据用户现有的各种信息,采用机器学习或者深度学习的方法,挖掘用户潜在的属性,从而为不同的用户打上其特有的标签的技术。基于这些标签,研究人员可以实现对用户更精准的服务。同时,得益于可视化技术的发展,可以很容易的将用户画像的结果进行可视化展示,用一种更加直观的方式,来获取用户画像的结果,使研究人员对数据的理解更加透彻,也为后续的工作提供了方便。基于上述信息,本文主要完成了用户画像技术的研究和可视化系统设计与实现。首先,以互联网社交媒体的微博为数据源进行了用户画像构建技术研究,建立了一种基于深层次的卷积神经网络模型。该模型可以通过将已经计算的每个卷积层输出的结果进行拼接,作为下一层卷积的输入,这样不仅可以使得上层特征在下层卷积中被充分利用,而且还能有效的利用到上下文信息间的相互作用,同时也可以实现对多尺度特征的灵活选择。此外,在每个卷积层中也加入了一个门控计算,通过门控计算,可以及时的选择出对实验结果有利的特征图,并且利用门控计算,也可以降低由计算过程中出现的梯度下降问题,使该模型可以灵活的增加卷积层数。其次,以政府扶贫数据为场景进行了基于精准扶贫的用户画像构建应用研究,采用了一种融合用户的统计特征和文本特征的卷积神经网络的方法。最后,采用Web技术设计实现了一个用户画像的可视化系统。在该系统设计中,结合了可视化的情景需求和数据多样性的特点,充分考虑到多维、多层次及多类型数据的可视化方式,通过Echarts等开源库,合理使用饼图和折线图等方式,实现对统计数据的展示;并且结合词云,散点图,下钻技术等方式,实现画像信息多粒度可视化,实现网页的个性化设计,并结合现有开源技术,实现网页的响应式布局和良好的人机交互功能等。本文在新浪微博数据集上进行了对比实验,实验结果显示,本文采用的深层次卷积神经网络模型具有良好的性能。由于可获取的政府扶贫数据有限,本文使用卷积神经网络进行实验,完成了贫困户贫困原因的分类操作,在可视化系统的构建上,本文使用了Ajax实现数据异步交互等操作,实现了用户画像的可视化展示。