论文部分内容阅读
微型网络博客(MicroBlog)是一种通过关注机制进行消息分享的网络平台,因其具有用户网络复杂、文本信息较短且数量冗杂、信息高时效性等特点,传统的推荐方式,并不能很好的适应网络微博环境。本着在一定程度上缓解“信息过载”效应,提高网络微博用户体验度的目的,本文在研究了网络博客中文本的结构特点后,结合文本分类算法以及用户画像模型构建技术,对传统的基于用户标签的推荐进行改进,将时间序列和用户画像进行结合,构造并设计了一种基于时间序列增长,动态更新模型标签的用户画像,在深入研究后提出了基于动态用户画像的推荐算法,将其作为推荐系统的核心算法。最后设计并实现了一个基于动态用户画像的推荐系统,该系统通过离线实验证明了本文的推荐算法在推荐精准度方面较传统推荐算法有所提高。本文主要做了以下三个方面的工作:1.在获取用于构建系统的原始文本信息方面,本文深入研究了基于WebMagic的网络爬虫技术,叙述了该网络爬虫的原理、工作流程以及部署方法,并在Windows平台上使用JAVA语言构建了一个网络爬虫实例,用来获得推荐系统所需的文本信息。2.在构建用户画像标签模型的研究过程中,本文深入研究了基于SVM的文本分类算法,并详细的叙述了该算法的文本分类过程、算法原理以及优劣势,其次深入研究了用户画像建模的相关技术,对用户画像的概念、用户画像构建过程进行了详细的描述,并在此基础上结合时间序列,提出一种基于时间序列的用户画像,并基于该画像模型提出了基于动态用户画像的推荐算法,该算法通过分时段分析用户的文本数据对用户画像进行更新。3.本文对推荐系统及相关技术进行了研究,对推荐系统的属性以及评估实验进行了详细的介绍,并对目前主流的推荐算法的原理和流程做了详细的阐述。本文对基于动态用户画像的推荐进行了相关实验分析,并基于该推荐算法构建了一个基础的推荐系统,该系统通过处理用户文本信息,构建用户的基础画像模型,结合时间序列动态更新用户画像,从而提高推荐的精准度。