论文部分内容阅读
推荐系统是解决电子商务平台信息过载问题的主要手段之一,相关研究表明,精准的个性化推荐能够提高消费者对电子商务平台的满意度、促进捆绑销售、提高产品的销量,进而增加商家和电子商务平台的经济效益。协同过滤方法是目前应用最为广泛的推荐技术,具有简单、合理、高效、稳定的优点。传统的协同过滤方法多依赖用户评分,然而评分数据自身存在一些缺陷,主要包括评分的稀疏性、动态性和缺乏情境信息,从而导致协同过滤方法面临许多挑战。对于两类产品(或服务),基于评分数据的协同过滤方法所面临的挑战尤其严重。第一类是传统电子商务环境下的高卷入度产品推荐,高卷入度产品通常是指具有高价值的耐用品。对于这类产品,首先,用户的购买记录较少,因而评分存在更加严重的稀疏性问题;另外,关于这类产品评分的动态性,目前没有相关研究给出明确的结论。第二类是移动商务环境下的地理位置服务推荐,这类推荐的特点是需要将情境信息考虑在内,而评分难以满足这一需求。为此,本文尝试引入评论文本和签到数据两类用户生成内容弥补评分数据的缺陷,改进传统的协同过滤方法。具体的研究内容和贡献主要包括:(1)运用实证研究的方法,从时间和序列两个维度明确了高卷入度产品在线评论的动态性,填补了相关研究的空白。本文从数值评分和评论文本两个层面研究高卷入度产品在线评论的动态性:对于评分的动态性,首先从时间和序列两个维度给出动态性的直观展示,初步确定动态性的存在;然后,通过有序对数单位模型建模评分与时间和序列两个变量之间的关系,根据模型确定时间和序列两种动态性的存在和表现形式;最后,基于自选择理论和动机理论,对两种动态性的成因进行分析和解释。另外,在评论文本层面,首先通过情感分析的方法挖掘评论文本中所蕴含的用户特征层的情感;然后,与评分的动态性相似,从时间和序列两个角度对用户情感的动态性进行实证分析,并对分析结果给出理论解释。(2)针对高卷入度产品推荐,设计基于评论文本的混合协同过滤推荐模型,解决了评分的稀疏性和动态性问题。为了克服高卷入度产品的评分稀疏性问题,采用主题建模、情感分析等文本挖掘方法深入挖掘评论文本中的产品主题、特征和用户情感等信息,以推测用户的未知评分。与以往的基于评论文本的推荐方法多使用评论文本的整体情感不同,本文尝试将用户特征层的情感用于虚拟评分预测,通过把用户特征层的情感转化为物品-主题评分矩阵,将评论文本与协同过滤方法融合起来。并且,在设计推荐方法时,重点考虑了在线评论的动态性问题,给出了相应的解决方案。通过在高卷入度产品数据集上的实验证明,本文所提出的方法能够有效地提高推荐的准确度。(3)针对移动环境下的地理位置服务推荐,将签到数据的时间效应和空间效应有机地融合到协同过滤方法之中,设计了情境感知的推荐模型,满足了该类推荐对情境条件的约束。具体来说,本文从时间和空间两个方面改进了地点相似度的计算方法。时间方面,通过时间分割法将时间因素引入到用户-地点签到矩阵中,并根据用户签到在时间上的连续性和不一致性计算了不同时间段之间的相似度,用以弥补由于时间分割所导致的稀疏性问题。空间方面,提出了空间接近度的概念,根据用户的签到历史找到其活跃区域,然后,在考虑用户的活跃区域以及用户在不同活跃区域的签到比例的条件下,给出了计算空间接近度的公式。实验证明,与同类推荐方法相比,本文的方法取得更好的推荐效果。通过研究,在理论上,深化了对评论文本和签到数据两类用户生成内容的特性和变化规律的认识,同时有效地解决了传统的协同过滤所面临的评分稀疏性、动态性和情境信息缺乏的挑战,为个性化推荐的研究提供了新思路;在实践上,针对两类不同产品所设计的推荐框架可以为相关企业设计推荐系统提供参考。