论文部分内容阅读
近几十年来,随着国际互联网和万维网的高速发展,互联网上的信息呈指数级增长,用户要从海量信息中查找出自己感兴趣的有用信息越来越难,出现了“信息过载”的现象。如何从这些海量的信息中挖掘出用户最感兴趣,最需要的信息,为用户的决策提供指导意见,成为一个热门的研究课题。语义网作为万维网的扩展,提供了更丰富的语义信息和更加结构化的数据,使网络上的信息更加易于机器的理解;另一方面,推荐系统的发展突破了传统搜索引擎的局限性,主动发掘用户的潜在偏好和兴趣信息,可以将用户最需要的信息推荐给用户。语义网和推荐系统从不同的角度试图解决信息过载的问题,基于语义网的推荐系统的研究有很大应用价值。本文对这两项技术的结合进行了有益的研究和探索,主要工作如下: (1)本文提出了基于语义网和协同过滤技术的FOAF-CF推荐算法。FOAF是语义网本体中一种基础词汇,主要定义了一种共享的连接关系,多用于社会化网络的好友关系。FOAF-CF算法利用了语义网和开放链接数据LOD进行协同过滤推荐,通过FOAF关系聚类用户,把FOAF相似度扩展到推荐物品的空间上,根据物品的相似度权重和来生成对用户的推荐。 (2)针对FOAF用户关联信息不足的问题,本文在FOAF-CF算法的基础上,结合社会化网络中流行的标签信息,提出了一种混合推荐算法FT-HYBRID-CF。标签是一种社会化网络中由用户提供的半精确的关键词描述,提供了对物品的特征表达。FT-HYBRID-CF在前端利用语义网和开放连接数据LOD提供的FOAF关系,通过FOAF相似度扩展用户和用户之间的关联性,后端利用物品和物品之间的标签相似度,增强了物品之间的关联性,进一步扩展了算法的推荐物品空间,生成对用户的推荐。 (3)针对本文提出的两种基于语义网的推荐算法,在Last.fm和DBTune提供的音乐和社会化网络的数据集上设计了相关的验证性实验,并且通过对基准算法的对比,分析了算法的准确性,有效性。实验结果表明FT-HYBRID-CF算法比FOAF-CF算法提供了更精确的推荐结果。两种算法根据语义网的特点,利用了语义网的优势,通过链接数据协同推荐,一定程度上提出了解决推荐系统数据不足问题的思路。