论文部分内容阅读
由WEB2.0技术引动的数据时代的变革,互联网用户再也不是被动接受信息,而是在互联网的世界中变得越来越主动,互联网用户能主动的通过WEB2.0网络平台与其他用户互动、分享生活。然而随着用户的急剧增加,以用户生产信息为主的新一代互联网信息模式造成了互联网信息的爆炸式增长,并且给用户找寻自己感兴趣的东西带来了麻烦。“信息过载”问题使得用户难以快捷、简便的获取自己需要的信息。而信息检索技术中的推荐技术由于能够主动的为用户推荐用户自己所需要的信息而广泛的被用户所接纳,因此信息过滤技术中的推荐技术成为当前学者们研究的重点。协同过滤成功之处在于它能够挖掘用户潜在的需求,为其进行推荐。但在实际应用中,仍然存在很多问题,如数据稀疏性问题、冷启动问题等。针对上述的关键问题,文章主要从如下几个方面进行研究:第一,通过对协同过滤算法当中相似度计算的研究和云模型的学习表明,利用云模型计算用户的云相似度取代传统的相似度计算方法,可以准确地计算用户的相似度,提高推荐质量;第二,针对传统基于用户的协同过滤算法计算过程中没考虑到用户属性的问题,本文提出的算法加入了用户特征属性。算法在计算用户相似度的时候加入用户特征属性相似性,通过加权因子的调和得到最终的相似性。算法能够更准确的获取相似的用户,且加入用户属性相似能够避免新加入用户无评分记录的冷启动问题;第三,为了解决源数据的稀疏性问题,对所提出的算法做出优化。算法首先利用云模型所得相似性对目标进行初步的评分,将结果填充到原输入矩阵中,得到较为完整的矩阵,然后根据新的输入矩阵进行用户的相似度计算,结合用户特征属性相似性计算用户的最终相似性,最后获得预测评分并对用户进行推荐;文章最后实验验证上述算法。实验结果表明:基于用户特征属性和云模型的算法能够针对用户进行更有效的推荐,通过加入了用户特征属性相似度,可以更准确的为用户提供具有个人特色的推荐结果,且能够解决了用户冷启动问题。优化后的算法不仅只有上述优点,还能够消解算法的数据稀疏性问题。