论文部分内容阅读
人们在获取信息内容的同时,很容易从自己的目标内容中发散到更多的海量数据中,从而不能及时的获得自己需要的信息。这种信息过载问题给我们带来很大的信息负担,不仅没有因为互联网技术而提高生产率,反而因为信息量庞大降低了生产率,这时就产生了一种信息推送服务模式,根据用户个性化的需求,考虑商品与商品,用户与商品和用户与用户间的相互作用的推荐系统应运而生,向用户推送可能需要但又很难主动获取的信息。而随着研究人员的进一步研究发现,电子商务广泛应用的传统推荐算法系统初期数据量小存在冷启动和稀疏性问题,从而带来准确性下降的问题。本文在研究了基于内容过滤的模型预测方法后,提出了融合情景数据和机器学习的贝叶斯网络模型构建推荐方法。用情景信息隐变量表示用户的偏好,对电影评分贝叶斯网络构建采用隐变量插入算法,用BIC评分在各种可行的半团结构中选择最优模型,EM算法迭代计算模型的条件概率参数,从而从额外数据集添加情景感知隐变量丰富MovieLens电影评分数据集,进而利用RBNL模型预测评分数据。而混合推荐策略可以综合两种推荐组件的优势,本文综合RBNL模型预测评分算法和传统协同过滤算法。利用误差差值矩阵在整体推荐系统中的占比得到当前运行时期推荐组件的权重,通过自适应权重归一化,调整不同推荐组件在混合推荐中的影响力度,将调整后的推荐组件的权重值与相应推荐组件给用户做出的评分预测做加权,合并各个推荐组件的加权预测值,最终得到混合推荐系统的最终评分预测。最后通过实验,可以发现本文提出的添加情景感知数据的模型预测方法相比不含情景数据的单一推荐方法准确度明显提升,但在系统后期数据量增大后,协同过滤算法因为数据稀疏性问题的缓和预测评分准确度大幅提升。本文提出的自适应权重的混合推荐策略能够综合两种推荐组件的优点,在系统运行初期,模型推荐算法误差更小,故系统整体预测准确率更优,而在系统运行中后期,协同过滤算法准确率提升,且系统消耗更少。所以自适应权重的混合推荐算法可以补充优点,克服不同时期数据量带来的缺陷,更好地提高推荐系统的性能。