论文部分内容阅读
经过多年的发展,互联网已经由以网页浏览为特征的Web1.0时代迈入了以用户交互为特征的Web2.0时代。用户总体规模及需求增长远远落后于信息增长速度,信息利用率呈现持续性的下降,这一现象被称为信息过载。目前,解决信息过载问题主要分为两个途径:信息搜索和主动推荐。主动推荐则能够通过对用户属性和行为的分析,能够为用户提供可能被其忽略的或未发现的具有潜在价值的信息。由于推荐技术在各类场景中展现出的应用价值,学者们对其进行了大量的研究,将推荐技术分为基于内容的推荐和协同过滤推荐两个大的方向。本文首先对社区发现以及推荐系统的研究现状进行了系统的总结,并在此基础上详细阐述了复杂社会网络分析、社区发现理论、推荐系统领域的经典理论。其次,本文在对传统协同过滤推荐算法的比较中发现了基于欧式距离的绝对相似度与基于皮尔逊相关性相似度的内在区别,并提出了优化的全局相似度概念,在一定程度上提升了相似度计算的准确性。再次,本文把社会学领域的社会网络概念及数据挖掘领域的聚类、关联分析等思想引入到推荐算法中,一方面通过社区发现算法对用户数据进行高效聚类,另一方面则通过群组推荐算法产生已聚类社区的最终社区推荐结果。本文同时考虑了群组用户的兴趣以及他们复杂的内部关系,通过将重叠社区发现算法和基于贡献度的协同过滤算法进行创新融合,以实现潜在群组的发现、建立、调整和面向群组的智能推荐。最后,基于Movielens开放数据集,本文设计了一系列相关实验以验证算法的有效性和准确性。实验结果表明本实验能够实现高效且准确的群组推荐。