论文部分内容阅读
面对用户的需求差异,在海量数据中为用户进行精确推荐存在较大困难。个性化推荐方法是解决上述问题的典型策略,它基于用户的历史行为数据精确地刻画用户画像,分析每个用户的真实偏好与需求,使用推荐机制为用户提供个性化智能服务。但是,由于个性化信息不易获取,并且存在用户兴趣迁移的情形,个性化推荐依然面临巨大挑战。本文在对个性化推荐的深入研究中发现,用户的个性化信息对推荐性能有较大的影响,充分使用特征选择的方法能够有效提取个性化信息,并先后提出了基于特征优化的随机森林推荐模型与基于特征枚举的Adaboost推荐模型。在对用户兴趣迁移的情形中发现,隐式反馈会受到用户潜在兴趣的影响,为此本文提出了融合多角度特征的个性化推荐模型。该模型充分提取有效特征并挖掘用户的隐式反馈信息,提升了推荐准确度。主要研究内容与贡献如下:(1)针对用户特征数量较多导致难以提取有效特征的问题,本文提出了一种基于特征优化的随机森林推荐算法,将分类算法融入到推荐过程中。该模型通过引入Gini指数来优化特征数量,同时结合随机森林分类算法对用户兴趣偏好进行预测,有效地提升了模型的准确度与泛化能力;(2)针对特征组较为单一,无法准确的刻画用户个性化偏好的问题,提出了基于ReliefF特征优化的个性化推荐模型。该模型充分考虑用户的历史行为与上下文信息,通过使用ReliefF算法提取有效特征,引入特征枚举策略构建多组特征,有效地挖掘用户的个性化偏好,并结合Bayes模型与Adaboost算法来提升推荐性能;(3)针对个性化信息不易获取且存在用户兴趣迁移的问题,提出了融合多角度特征的Xgboost个性化推荐模型。该模型融合用户、产品、环境等多角度特征,充分兼顾用户的潜在偏好与隐式反馈信息,并结合Xgboost算法对用户偏好进行预测,该模型提升了推荐的准确度。本文对所提出的推荐方法进行了理论分析,同时基于推荐领域相关数据开展了实验验证,均表明建议方法是有效的。