论文部分内容阅读
随着互联网技术的飞速发展为人们的生活带来诸多方便的同时,网络信息资源的爆炸式增长导致了信息出现“超负载”的现象,而推荐技术的应用使人们不同兴趣偏好的个性化的需求得到满足,因此针对个性化推荐的研究也越来越多。而随着web2.0主要应用之一的社会化标注系统的发展,用户自由的对喜欢的网络资源进行标注,所产生的新型数据形式标签既体现了用户兴趣偏好,又描述了资源的特征及潜在属性,基于这种优点非常适合利用其进行推荐研究。本文首先分析国内外相关研究及应用现状,总结前人研究成果与理论,分析现有研究中还存在的一些问题,主要有:(1)标签自身带有的语义模糊、歧义等问题,制约着应用于个性化推荐的质量;(2)当前在对标签表征用户兴趣特征的研究中,仅从数量和结构上考虑用户与标签的关系,无法全面准确表述用户的兴趣特征;(3)用户快速增长的标注量使得计算规模大幅度增加,降低了推荐系统的效率。为解决上述问题,本文针对社会化标注系统的特性,基于社会化标注挖掘用户兴趣,并提出了基于用户兴趣模型的个性化推荐算法,并通过实验研究对文中提出的改进算法进行了验证分析。本文完成的主要工作如下:(1)融合社会关系的标签潜在语义主题挖掘。分析了社会化标注中用户、资源、标签间的潜在语义关系,并考虑了用户社会关系对其标注行为的影响,基于此引入LDA模型进行用户标签潜在语义主题的挖掘,该方法能较好的解决了标签的语义模糊性,为提供高质量的用户兴趣建模及个性化推荐打下了良好基础。(2)基于标签主题的用户多兴趣模型构建。通过分析标注系统中用户兴趣模型的特点,利用标签主题构建用户多维兴趣模型,并采用遗忘因子实现动态更新,该模型较好的表达用户兴趣偏好,保证了推荐的实时和有效性。(3)基于用户兴趣模型的个性化推荐算法。借助用户兴趣模型计算用户间的相似度,降低计算维数,克服稀疏度;同时在用户兴趣范围内搜索推荐资源,保证并提高了推荐算法的质量与效率。最后,采集社会化标注系统Cite Ulike站点数据进行实验分析,验证了本文提出的改进算法准确表达了用户兴趣偏好,有效提高了个性化推荐准确率。