论文部分内容阅读
随着互联网技术的发展,越来越多的人会选择在网上进行购物、查看新闻、看电影等等,但是名目繁多的选项会让人不知如何选择,由此出现了所谓的“信息过载”现象。所以,对过多的信息进行筛选是很有必要的,可以改善用户的上网体验,快速地定位找到用户所需的信息,由此推荐系统应运而生。同时,随着大数据时代的到来,越来越多的数据会以流的形式出现,但对数据流的利用率并不是很高,于是本文提出了将数据流分析与推荐系统相结合的想法,以实现更加个性化的推荐方案。本文立足于对数据流中的点击流数据进行研究分析,在此基础上从两个方面研究推荐方法。首先,在MapReduce并行计算框架下研究频繁项集的挖掘,提出了一种新的基于二叉树的并行频繁项集挖掘算法(以下简称为FIMB算法),利用一次Map/Reduce过程即可完成挖掘,不需要进行迭代计算,充分应用了集群的并行性,并根据挖掘结果进行关联推荐。其次,本文提出了一种在社交网络中基于信任的推荐系统模型,该模型的主要思想是代理在社交网络中取得所需信息,并通过这些信息之间的信任关系来进行信息过滤;研究中还发现网络的密度、代理之间偏好的各异性和知识的稀疏性都是影响系统性能的至关重要的因素。最后,本文将点击流数据分析与两种推荐模型相结合,提出了一种基于点击流的推荐系统框架模型,并用流程图的形式给出了系统框架,同时列举了几种准则来评估推荐系统的推荐效果。本文通过实验对比的方式证明了FIMB算法的效率高于CD和DD两种并行算法,并采用数学公式的计算方法来近似分析了社交网络中基于信任的推荐效果,具有一定的研究价值和创新性。