论文部分内容阅读
伴随着互联网科技的飞速发展,电子商务也逐渐走进大众视野,并成为人们日常生活中不可或缺的一部分。电商的发展必然伴随着用户和项目数量不断增加,且项目数量远远大于用户数量。这时如何在海量的数据中快速找到令用户满意的项目变得尤为重要。在这种时代背景下,个性化推荐技术应运而生,它通过分析用户行为并主动向用户提供个性化的信息服务和决策支持。基于用户的协同过滤推荐是个性化推荐中应用最多的一种算法,针对传统基于用户的协同过滤算法存在数据稀疏性问题而导致最终推荐效果不理想的情况。本文提出一种基于用户相似度改进的协同过滤方法,通过在皮尔逊计算公式中引入巴氏系数和项目共同评分占比因子,将巴氏系数和皮尔逊相似度融合对用户局部相似度进行计算,并采用项目共同评分占比因子对用户全局相似度进行计算。改进后的皮尔逊相似度能有效降低因数据稀疏而导致在计算用户相似度时的偶然性对最终推荐结果造成的误差。针对传统Apriori算法在进行项目推荐时,需多次扫描交易数据库以及若项目不在规则中则无法提供有效推荐的问题。提出基于矩阵的项目属性关联规则推荐,通过将用户历史行为转换为矩阵形式,挖掘项目属性之间存在的潜在关联关系为用户提供推荐。针对基于用户的协同过滤算法存在的新用户问题,关联规则推荐算法通过挖掘平台消费者的购物习惯,得到项目之间的潜在关联关系,可改善当用户行为数据稀少的情况下无法为用户提供推荐的问题,且基于用户的协同过滤也能有效改善关联规则推荐的新项目问题。因此,本文提出了将基于用户的协同过滤和关联规则混合并采用Top-N算法实现最终推荐。综上,本文对皮尔逊相似度计算方法进行了改进,使其能很好的适应数据稀疏性问题。并在传统Apriori算法的基础上提出了基于项目属性关联规则推荐算法,有效弥补了关联规则数目少而难以进行推荐的问题。并通过实验表明,这两种改进都能有效提高推荐性能。最终通过混合方式将两种推荐算法组合实现最终推荐,能有效改善数据稀疏性和冷启动问题。