论文部分内容阅读
近年来,推荐系统在信息过滤和信息检索中起着至关重要的作用,并广泛应用于社交网络,电子商务以及新闻推荐等领域,取得了巨大的经济效益和社会效益。但是,推荐系统仍然存在数据稀疏性及冷启动等问题,导致推荐精确性偏低,因此,如何解决信息过载问题,为用户提供高质量的推荐信息,仍然是当前的研究热点,具有重要的研究价值。本文重点研究了基于机器学习的推荐系统关键技术及应用,解决数据过载问题,旨在为用户提供高效的个性化推荐。主要研究内容分为四部分。(1)基于pairwise排序学习方法,研究了如何利用隐反馈信息学习用户的兴趣偏好,并提出了BPLR模型。基于用户兴趣偏好模型,BPLR根据用户历史行为将项目分为正反馈项,潜在反馈项及负反馈项,以便进行细粒度的兴趣偏好学习,其中潜在反馈项的生成利用了用户社交网络与项目的流行度,确保推荐结果的准确性与完整性。BPLR使用贝叶斯推断进行模型学习,并采用随机梯度下降法进行参数学习。此外,为过滤掉无效的样本,选择有效的模型训练样本,论文提出了一种动态采样策略DSS,该算法能够明显减小计算复杂性,并加快模型训练速度。在实际应用中,隐反馈信息非常丰富,并且容易收集,而BPLR能够有效地利用用户隐反馈信息进行排序推荐,因此具有广泛的应用前景。此外,论文还从理论上分析了BPLR模型的收敛性,并给出了相关的定理及证明。(2)深入研究了用户社交关系及兴趣偏好对推荐结果的影响,提出了SRMP推荐模型。该模型将用户信任关系进一步细分为信任与被信任关系,计算用户在社交网络中的专家水平值,并将其作为用户的权重,以限制矩阵分解中用户和项目的特征向量的学习。在模型优化阶段,SRMP将项目按照类别标签进行分类,将每个类别的项目作为独立的社交群体,并进行模型训练及评分预测,以提高推荐精度。研究表明,SRMP能够捕获用户间复杂的社交关系,学习用户的兴趣偏好,以此解决推荐系统的数据稀疏性问题,此外,SRMP还可以利用社交关系解决冷启动问题,并明显提高推荐的准确性及用户满意度。(3)深度学习方法在信息处理与信息检索中具有强大的优势,重点研究了深度学习算法利用数字评分,用户画像,项目属性以及可用附加信息进行精确推荐的原理及技术,并提出了深度推荐模型DLMR,该模型主要包括推荐选项生成与推荐选项重排序。在推荐选项生成过程中,DLMR采用主题分布模型LDA,从文本评论信息及项目背景信息中学习用户的兴趣分布,再将其融入卷积矩阵分解模型,提取用户和项目的特征向量,并据此进行数字评分预测,生成推荐选项。为进一步提高推荐精度,DLMR采用了一个三层降噪自编码器网络,利用可用的附加信息对生成的推荐选项进行重排序,生成最终的top-N推荐列表。实际应用中,DLMR利用深度学习模型,能够捕获用户之间、项目之间以及用户与项目之间的复杂关系,学习用户的兴趣偏好,为用户提供精确的个性化推荐。因此,基于深度学习的推荐方法具有强大的数据处理能力,能够处理具有各种不同特征的数据,有效地利用各种有用信息提高推荐结果精确度,是当前的研究热点,具有较好的发展应用前景。(4)研究了大规模在线推荐中的数据稀疏性问题,以及在线数据更新问题,提出了在线推荐模型LsRec,该模型主要包括离线计算和在线更新。LsRec根据用户的社交网络,计算用户的社交影响力,并将其融入矩阵分解模型,以限制用户和项目的特征向量学习。为了提供更加精准的推荐,LsRec采用TF-IDF将项目表示为向量,并采用k-means++聚类算法,对项目进行聚类。LsRec分别在生成的项目聚类中进行模型学习,以此提高推荐精准度。为确保模型的有效性和收敛性,论文给出了相关的定理,并提供了相应的理论证明。为解决在线数据更新及冷启动问题,LsRec基于快速矩阵变换法,提出了在线增量更新策略,能够及时捕获用户的兴趣偏好变化,具有良好的可扩展性,为用户提供准确的推荐服务。在大规模在线推荐应用中,LsRec能够有效地缓解数据稀疏性问题,并且快速高效地更新数据,为用户提供及时高效的在线推荐服务。