论文部分内容阅读
随着信息时代的到来,数据呈爆炸式增长,如何从海量数据中找到用户的兴趣点,并将用户感兴趣的物品推荐给用户,成为当今各领域研究的热点。同样在各高校图书馆中,如何解决信息资源过载并找到用户感兴趣的图书推荐给用户,成为建立智慧图书馆个性化服务的重要研究方向。论文提出在个性化信息服务中,通过分析用户的行为信息,构建用户兴趣模型,并在用户模型的基础上,准确理解在校用户的个性化需求,设计高效的推荐算法为用户进行推荐,提高用户满意度;同时采用Hadoop技术框架并行化处理数据,提高计算效率。 论文主要的工作如下: 1.对高校图书馆书籍分类进行了研究,结合大型图书商城的分类、《中图法》、《中分表》等对图书进行了分类。 2.挖掘用户兴趣爱好,建立用户兴趣模型。首先根据在校用户填写的信息或者用户的属性信息初始化用户兴趣模型;然后根据用户的浏览行为建立用户短期兴趣模型,并通过用户行为借阅时间、浏览次数、收藏、评分归一化加权建立用户长期兴趣模型,不断更新用户兴趣库,获取用户喜好信息。 3.图书推荐算法研究。根据用户对图书的评分信息,为用户进行协同过滤推荐。当基于用户浏览行为建立短期用户模型时,找到用户偏好图书类别中近期浏览次数较高的的图书,为用户推荐与这些图书相似较高的图书;当基于用户多行为建立长期用户模型时,根据用户已有的评分,预测用户偏好图书类别中未评分的图书,推荐给用户预测评分较高的图书,并利用MAE值对预测评分和通过用户调查得到的实际评分进行比较,发现利用修正余弦进行相似度计算推荐精确度最高。对于图书馆中的新书和热门图书,采用基于内容的推荐,并分别解决了新书和新用户的冷启动问题。最后通过实验验证了图书推荐算法在一定程度上满足了用户的个性化需求。 4.搭建了基于Hadoop的伪分布式实验环境,对基于用户-图书评分的协同过滤算法进行了并行化设计,实验结果表明并行化算法可提高计算效率。