基于数据挖掘的个性化推荐算法研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:fbhww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这个信息爆炸的时代,每天互联网上产生海量的数据,对于如何能够准确而迅速地找到自己想要的信息是亟待解决的问题。推荐系统能够帮助用户在海量的资源中寻找到真正有价值的信息,节约用户的寻找成本,同时也提高用户对网站的忠诚度,增加网站收益。目前推荐系统在电子商务、广告投放、社会网络、数字图书馆、电影和音乐点播等领域得到广泛应用,未来的社会化网络将被推荐系统所推动发展。所以推荐系统逐渐得到学术界和工业界的广泛关注。美国计算机学会和国内外期刊多次把推荐系统列为研讨主题。其中,推荐算法在推荐系统中具有至关重要的地位。因此,需要研究一种高效的个性化推荐算法,充分利用现有的数据集,深入挖掘用户和其有过评分行为的物品之间的关系,建立预测模型,来预测每个用户对于他没有过行为的物品的兴趣度,从而针对每个用户形成自己的推荐列表,进行个性化推荐。本文具体从以下三个方面对个性化推荐算法进行研究:(1)基于隐含语义模型(LFM)优化方法的研究LFM可以找出隐含的主题或分类,并通过隐含的主题或是分类建立特征之间的联系。这个算法的核心思想是先建立用户对物品的评分矩阵,再求解两个低维矩阵,使得两个低维矩阵相乘可以近似表征这个评分矩阵。一般求解LFM采用梯度下降的方法来最小化损失函数,但考虑到应用在推荐系统领域中,要处理海量的数据,所以本章提出了采用CUDA对随机梯度下降算法并行化的方法提高推荐效率。(2)基于CUDA并行化PersonalRank算法利用随机游走理论可以较好的解释PersonalRank算法,但该算法训练数据的时间损耗过大。因为为了给每个用户推荐物品,需要在整个二分图上进行不断迭代,直到整个二分图上的每个结点的PR值收敛。所以这一过程所需耗费的时间过长,不仅无法提供实时在线的推荐,而且生成离线推荐的结果也非常耗时。因此,针对这一问题,本文对PersonalRank算法采用CUDA进行并行化,从而提高推荐的效率。(3)隐含语义模型和PersonalRank算法混合在推荐算法的应用中,优秀的个性化推荐方法一般是通过混合对多个乃至上百个模型才得以取得良好的推荐效果,因此可见多模型的混合对提高推荐的精确度起着必不可少的作用。因此,提出了一种融合隐含语义模型和基于随机游走的PersonalRank算法的混合推荐算法,先利用隐含语义预测用户对没有评价过的物品的评分,对于预测评分大于某个阈值的来填充用户评分矩阵,再对用户和物品建立图模型,然后利用PersonalRank算法计算每个用户的对每个物品的Rank值,取Top-N进行推荐给用户。最后,在Moive Lens数据集上验证了利用隐含语义模型填充稀疏矩阵对预测评分效果。
其他文献
前文介绍的是:染整短流程前处理工艺助剂设备的进展.
在清水混凝土施工过程中最主要的就是加强组织设计,并且对施工的全过程进行监理保证每一个环节都能够符合要求,这样才可以保证清水混凝土施工的整体效果。本文通过对清水混凝
改革越难,越考验改革者的气度、格局和境界。今天对改革者而言,需要的不仅是解放思想,更要着眼全局、敢于担当,破除私心,拿出“苟利国家生死以”的决心;成全公义,秉持“虽千万人吾往
报纸
直接将密文属性基加密(CP-ABE)运用于云环境中,将造成云访问控制的安全和计算开销问题。为此,提出一种支持多授权中心的属性撤销方案(RMCP-ABE),通过采用逻辑二叉树和每属性
目的探讨人文关怀在减少护患纠纷,提高患者满意度中的作用。方法对该院随机抽取实施人文关怀的378例患者进行分析。结果人文关怀实施后在护士服务态度、操作水平、沟通能力方
我们在国内有关兄弟单位的大力协同下,基本完成了缓发中子测井的原理检验工作。本文叙述了室内原理模拟实验,作野外原理检验用的缓发中子测井装置以及在野外的实验结果。工作
房地产业是一个高风险、高利润的行业,因此房地产开发项目可行性研究中风险评价显得十分重要. 采用蒙特卡洛法(MC方法)对房地产项目进行风险评价,可为项目决策提供科学依据.
介绍了首都医科大学政府采购预算管理的相关工作,从制度建设和信息化建设等方面进行深入探讨,为实现高校政府采购预算的科学化管理提出建议。
为明确甲酸乙酯对仓储害虫的实际控制效果,避免二氧化碳对熏蒸作用的影响,该研究利用循环熏蒸系统(FTFS),测定甲酸乙酯对米象、赤拟谷盗、谷蠹三种主要仓储害虫混合虫态的熏
客运专线建设目的是为更好地满足旅客的出行需求,因而其列车开行方案也必须体现以旅客为本,服务旅客、方便旅客的原则。首先提出旅客出行方便度概念,并研究不同时段旅客出行的方