基于Hadoop的高校图书馆个性化信息服务研究

来源 :河北农业大学 | 被引量 : 0次 | 上传用户:fcfy99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,数据呈爆炸式增长,如何从海量数据中找到用户的兴趣点,并将用户感兴趣的物品推荐给用户,成为当今各领域研究的热点。同样在各高校图书馆中,如何解决信息资源过载并找到用户感兴趣的图书推荐给用户,成为建立智慧图书馆个性化服务的重要研究方向。论文提出在个性化信息服务中,通过分析用户的行为信息,构建用户兴趣模型,并在用户模型的基础上,准确理解在校用户的个性化需求,设计高效的推荐算法为用户进行推荐,提高用户满意度;同时采用Hadoop技术框架并行化处理数据,提高计算效率。  论文主要的工作如下:  1.对高校图书馆书籍分类进行了研究,结合大型图书商城的分类、《中图法》、《中分表》等对图书进行了分类。  2.挖掘用户兴趣爱好,建立用户兴趣模型。首先根据在校用户填写的信息或者用户的属性信息初始化用户兴趣模型;然后根据用户的浏览行为建立用户短期兴趣模型,并通过用户行为借阅时间、浏览次数、收藏、评分归一化加权建立用户长期兴趣模型,不断更新用户兴趣库,获取用户喜好信息。  3.图书推荐算法研究。根据用户对图书的评分信息,为用户进行协同过滤推荐。当基于用户浏览行为建立短期用户模型时,找到用户偏好图书类别中近期浏览次数较高的的图书,为用户推荐与这些图书相似较高的图书;当基于用户多行为建立长期用户模型时,根据用户已有的评分,预测用户偏好图书类别中未评分的图书,推荐给用户预测评分较高的图书,并利用MAE值对预测评分和通过用户调查得到的实际评分进行比较,发现利用修正余弦进行相似度计算推荐精确度最高。对于图书馆中的新书和热门图书,采用基于内容的推荐,并分别解决了新书和新用户的冷启动问题。最后通过实验验证了图书推荐算法在一定程度上满足了用户的个性化需求。  4.搭建了基于Hadoop的伪分布式实验环境,对基于用户-图书评分的协同过滤算法进行了并行化设计,实验结果表明并行化算法可提高计算效率。
其他文献
移动数据库的研究是当前计算机领域的一个热点。作为移动数据库的基础性技术之一,移动事务管理的任务是在移动环境下网络不稳定、主机节点移动性等条件下实现数据库访问的一致
在日常生活中,人们常常会遇到模糊图片,造成模糊的原因有多种,如拍摄时物体运动,或者设备晃动,或者对焦失误等等。为自然图像去除模糊恢复清晰是近年来的研究热点。本文提出
随着Internet的飞速发展,网络数据库的安全已成为网络安全的焦点,研究针对SQL攻击的数据库防护技术来提高安全性的需求越来越迫切。目前国内针对包括SQL攻击在内的网络攻击主
计算机人脸识别技术是一种重要的生物特征提取技术,本文通过研究特征提取和特征分类,重点研究静态的人脸图像识别方法。本文在特征提取部分深入研究了基于主成分分析(PCA)的
随着互联网的迅速普及和互联网模式的创新,越来越多的游客通过互联网查询旅游信息,但是一些旅游景点的信息化程度不高,搜索引擎虽然索引了很多网页,但是其主要基于关键字匹配
在企业信息化系统中,由于系统运行环境的异构、自治和分布等特性日益突出,对原信息化系统进行并行化、分布式重构,来提高整个系统处理速度的需求变得越来越迫切。同时此类系
随着信息时代科技进步和数据量的剧增,数据、信息作为一种新时代的资源,影响商业利益,推动经济发展,成为被企业和个人关注和争夺的焦点。争夺的背后是大量数据的存储、计算和处理
全球Internet的蓬勃发展,特别是移动互联网的兴起,促进了P2P技术的兴盛,以P2P技术为基础的各种文件共享、即时通信、流媒体、分布式计算程序都获得了广泛的应用,VoIP作为一种
随着网络资源数量的不断增长,信息更新的不断加快,信息冗余、主题参杂等问题相继出现,人们想高效地搜索到自己想要的信息变得越发困难。在解决这些问题的过程中,提供个性化服
不论是在传统网络中,还是在无线传感器网络中,路由算法都是支撑网络传输的关键技术。本文首先介绍无线传感器网络路由协议的特点以及分类,分析了当前的经典无线路由协议。重