论文部分内容阅读
随着互联网的深入发展,用户时时刻刻都在面临着海量、庞杂和无序的信息洪流,不可避免地陷入信息过载的困境。个性化推荐作为一种信息过滤方法,被引入到搜索引擎、新闻推送和电子商务等多种研究和应用中来,一定程度上缓解了这一问题。然而,目前个性化推荐系统仍面临着冷启动、数据稀疏和可解释性等局限,导致用户个性化信息需求无法得到有效满足。在此背景下,基于评论短文本的个性化推荐系统近年来被广泛研究。其利用评论等短文本信息识别用户个体行为特征,作为个性化推荐系统的背景知识,以增强传统推荐方法。但是用户偏好存在极大地动态性和复杂性。由于这些推荐模型未能深入理解网络用户行为背后的心理诱因和外部社会影响因素,导致其在应对以上问题时仍存在不足之处。基于此,本文从营销学相关用户行为理论入手,提出利用网络用户生活方式来表征用户深层次的心理诱因和外部环境影响因素;进而融合生活方式,构建整合推荐模型,以期提升现有个性化推荐系统。首先,基于深度学习、情感分析等方法构建七维度中国网民生活方式词典以自动识别用户生活方式。其次,将生活方式融合到基于内容和协同过滤两类推荐模型中,探索生活方式及其细分维度在推荐系统中的作用及其差异。再次,利用现实场景中的网络用户浏览日志数据,经过数据预处理,构建整合网络用户生活方式的推荐模型并与基准推荐模型进行比较实验。最后,研究在比较整合网络用户生活方式的推荐模型和基准推荐模型的推荐准确率和分析网络用户生活方式在个性化推荐系统中提升作用的基础上,比较了不同生活方式细分维度在整合推荐模型准确率提升上的差异。研究结论表明,生活方式作为一种表征用户深层次心理特质与外部社会影响的因素,能够有效提升个性化推荐系统的准确率,不同生活方式细分维度对推荐系统的提升效果不同。同时,本研究所提出的生活方式自动识别算法具备有效性。研究为中文互联网个性化服务研究和应用提供新的理论视角和方法实践,为互联网信息服务提供商面向不同生活方式人群,进行个性化信息定制和推送提供一定的指导。本研究分为六个章节,每章节具体内容如下:第一章节是绪论。主要是对本文的研究背景、研究意义、研究内容和研究方法以及本文所做的创新工作等做一个全局的阐述。第二章节是相关理论及研究现状。总结了基于短文本评论的推荐系统、生活方式与用户偏好两大块文献综述内容。阐明了以往研究的不足,确定了本文所应用的理论和方法。第三章节构建了中国网民生活方式词典,以实现用户生活方式的自动识别。第四章节将所识别的中国网民生活方式整合到基于协同过滤和基于内容的推荐系统中,以探索生活方式及其细分维度在个性化推荐系统中的作用和差异。第五章节为实验过程。利用了现实场景中的用户浏览日志数据,进行了数据预处理和推荐模型的算法构建,完成了实验。第六章节针对实验结果,分析了中国网络用户生活方式及其细分维度在个性化推荐系统中的作用及差异。此外,总结了本研究的不足之处,指出了未来研究方向。