论文部分内容阅读
伴随着网络时代的大发展,人们要在浩如烟海的网络数据中,发现自己感兴趣的数据越来越难。而个性化推荐系统,为解决这一问题提供了一个非常好的思路。它可以通过显性或隐性的方式收集信息来产生个性化的推荐。虽然,由于人们在个性化推荐方面已经做出了大量的研究。但是,个性化系统还是在预测方面存在很大的不足,特别是在对用户模型的预测方面。为此我们引入了社会化标签系统。而作为web2.0的代表技术之一的社会化标签系统,也在信息的标注方面取得了不错的成效,并已经成功的应用于网络的很多方面。社会化标签系统,不仅能够完成对网络数据的较为合理的分类。它的社会化特性,使得我们能够从中间挖掘出很多的潜在用户信息以及用户的社会化关系。本文主要是提供了一种基于社会化标签的混合推荐系统。它的核心思想主要集中在以下几个方面:1、首先,用户基本模型和资源基本模型的建立。它是采用基于用户-标签、资源-标签的权重矩阵来表示的,而这些权重的提取时基于TF-IDF的文本信息提取技术。2、其次,同义词提取技术。为了使得标签能够更为准确反映真实的信息,本文对得到的数据进行了同义词提取环节。3、再次,对社会化属性的挖掘。为了挖掘出标签系统中潜在的用户与用户的关系,本文使用了基于关联数据挖掘算法Apriori对其社会属性进行挖掘。这样做的目的是为了提高用户模型表示的准确性。4、还有,采用基于兴趣的方式进行个性化推荐。为了更为准确的预测用户的模型,采用了聚类算法将标签聚类。在聚类的基础上预测,一般会达到更为准确的效果。5、最后,在预测的用户模型的基础上,采用基于内容和基于协同过滤的混合技术产生个性化的。通过本文的研究,提出了一个教学资源个性化推荐系统的模型,和一些具体实现需要的细节,提供了一种比较新颖的系统结构来实现个性化的教学资源推荐(例如在用户模型的预测方面,是将两种数据挖掘技术结合起来,这样使得得到的用户模型可能更为准确)。只需要对其进行少量的修改,它便可以应用于其他方向的个性化推荐。