图书馆读者行为分析方法研究

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:chyfandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]以上海浦东图书馆的自动借还书系统——“Horizon系统”中的借阅记录和读者信息为基础数据来源,采用数据挖掘技术中的关联规则Apriori算法,分析读者的行为模式。
  [关键词]读者借阅行为分析,Apriori算法,关联规则
  中图分类号:F90 文献标识码:A 文章编号:1009-914X(2017)28-0336-02
  1 传统方法研究读者行为分析以及不足
  1.1 读者问卷调查方法
  问卷调查就是将若干份事先设计好的统一的问题表格,即问卷,通过派遣调查员或通过邮局,送到每一个调查对象手中,由被调查者自行填答问卷,然后由调查员收回仍通过邮局寄回的调查方法。
  夏训明在《我校多校区办学格局下师生对图书馆资源与服务的需求调查》文中介绍,对校各个校区师生进行了一次大型的读者问卷调查。通过分析调查结果,找出图书馆工作中存在的问题与不足,提出相应的对策,为改进图书馆服务与管理提供借鉴。
  传统的读者问卷调查数据角度,进行较为表面的数据分析。其存在许多问题:其一,问卷制作太过主观直白。问题和答案设置必定带有调查者的主观思想,不能客观反映读者信息情况。而我们通过数据库关联规则探索,能发现许多平时不易发现的情报内容,更有研究价值。其二,答题者的主观性干扰。读者可能答题过程中,有胡乱填写或者带有主观性想法。如调查来图书馆借书频率,是否有不良借阅情况,读者会记错次数或者碍于面子不承认不良借阅。其三,调查人群的片面性。虽然是随机调查问卷,但是人群不一定涵盖常来的读者群。如前来参与调查的人群,其中年幼人群和高龄人群由于年龄限制,可能参加调查的概率就少了许多;忙碌人群虽然经常来图书馆,但是可能没时间填写问卷。其四,调查结果的处理,往往是直接的选项统计报表。只能反映表面的数据情况,深层次的各属性间的内在关联情况,都是这些问卷方法做不到的。
  1.2 服务质量与读者行为的分析方法
  《高职院校图书馆服务质量与读者行为意愿研究》一文,通过对图书馆服务质量含义的阐述,分析了读者行为的特点以及图书馆服务质量与读者行为意愿的关系,提出了优化图书馆服务的建议。
  基于服务于读者行为的分析,涉及读者的满意度问卷调查、提高服务质量、服务补救等角度,探讨如何更好的服务读者,提高读者的借阅兴趣。该角度由于许多都是结合问卷调查得到的结果,其次,提高服务质量虽然是吸引读者借阅的一种方式,但是硬件设施的改善同样也会大幅度提高读者满意度,吸引读者前来借阅书籍。因此单纯从服务读者角度,谈论问题有些片面和主观。
  2 基于Apriori算法的读者行为分析
  该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用找到的频集产生期望的规则,产生只包含集合的项的所有规则。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。以上算法使用递归的方法。
  以下基于Apriori算法结合图书馆借阅系统,选取几条读者记录为例,举例说明读者频繁项集的构建,并介绍基于Apriori算法讨论读者行为分析的步骤。
  2.1 读者频繁项集的构建方法
  假定数据以最小支持度为2,扫描数据库,生成候选1项集:
  244013 1,王春宜 1,女 4,湖北省 2,1978 2,青壮年 6,244014 1,杨丽萍 1,244015 1,张亦扬 1,上海市 3,男 3,2006 1,儿童 1,244016 1,刘勋 1,1981 1,244017 1,周润杰 1,1984 2,244021 1,王燕雯 1,山东省 1,1996 1,244022 1,臧东贺 1,吉林省 1,女 4,湖北省 2,1978 2,青壮年 6,上海市 3,男 3,1984 2
  2.2 基于Apriori算法的读者行为分析
  按照如上方法,依次构造最小支持度为2的读者频繁项集:
  1)扫描数据库,生成候选1项集和频繁1项集:
  244013 1,王春宜 1,女 4,湖北省 2,1978 2,青壮年 6,244014 1,杨丽萍 1,244015 1,张亦扬 1,上海市 3,男 3,2006 1,儿童 1,244016 1,刘勋 1,1981 1,244017 1,周润杰 1,1984 2,244021 1,王燕雯 1,山东省 1,1996 1,244022 1,臧东贺 1,吉林省 1,女 4,湖北省 2,1978 2,青壮年 6,上海市 3,男 3,1984 2
  2)生成候选2项集,扫描数据库计数,比较最小支持度生成频繁2项集:
  女,湖北省 2,女,1978 2,女,青壮年 4,女,上海市 0,女,男 0,女,1984 1,湖北省,1978 2,湖北省,青壮年 2,湖北省,上海市 0,湖北省,男 0,湖北省,1984 0,1978,青壮年 2,1978,上海市 0,1978,男 0,1978,1984 0,青壮年,上海市 2,青壯年,男 2,青壮年,1984 2,上海市,男 2,上海市,1984 1,男,1984 1,女,湖北省 2,女,1978 2,女,青壮年 4,湖北省,1978 2,湖北省,青壮年 2,1978,青壮年 2,青壮年,上海市 2,青壮年,男 2,青壮年,1984 2,上海市,男 2
  3)生成候选3项集,扫描数据库计数,比较最小支持度生成频繁3项集。
  女,湖北省,1978 2,女,湖北省,青壮年 2,女,1978,青壮年 2,湖北省,1978,青壮年 2,青壮年,上海市,男 1,青壮年,上海市,1984 1,青壮年,男,1984 1,女,湖北省,1978 2,女,湖北省,青壮年 2,女,1978,青壮年 2,湖北省,1978,青壮年 2   ………省略
  结果:
  项集 支持度计数
  女,湖北省,1978,青壮年 2
  2.3 分析数据
  2.3.1 数据的预处理
  由horizon系统导出相应的读者信息,包括读者证号、读者姓名、身份证号、馆藏条码、文献名称、中图法条码、借阅日期、不良标记类型、金额(即非正常借阅时产生的逾期费)、应还日期、时间(即日期的具体时刻,于研究内容没有太大意义,舍弃)、实际归还日期;由身份证号再整理出读者的籍贯、出生年份、性别;由中图法条码结合中图法分类,整理出图书类型一栏。
  根据读者借阅行为将读者分为三个类型:正常借阅读者、已归还图书并产生逾期费的读者、仍未归还到期图书读者。
  2.3.2 数据的关联分析
  读取省份统计表,为缩小运算范围,最小支持度设为20。
  在实验结果中筛选有意义的统计数据,获得读者基本情况如下:
  1)可获得读者省份分布情况信息,如下:
  频繁项:上海市,支持度计数:379;
  频繁项:江苏省,支持度计数:95;
  频繁项:安徽省,支持度计数:79;
  频繁项:河南省,支持度计数:53;
  频繁项:浙江省,支持度计数:43;
  频繁项:山东省,支持度计数:43;
  频繁项:江西省,支持度计数:42;
  频繁项:湖北省,支持度计数:39;
  可知主要读者群体来自上海本地,其次为江苏和安徽。
  2)读者年龄段分布情况如下,可知读者相当一部分是青壮年。
  频繁项:青壮年,支持度计数:804;
  频繁项:儿童,支持度计数:42;
  频繁项:中年,支持度计数:83;
  频繁项:老年,支持度计数:24;
  3)选取支持度计数为10的关联频繁项集,并筛选年龄段与省份关联的数据如下:
  频繁项:儿童,上海市 支持度计数:27
  频繁项:中年,上海市 支持度计数:35
  频繁项:老年,上海市 支持度计数:15
  频繁项:青壮年,上海市 支持度计数:302
  频繁项:青壮年,江苏省 支持度计数:86
  频繁项:青壮年,山东省 支持度计数:40
  频繁项:青壮年,河南省 支持度计数:46
  频繁项:青壮年,陕西省 支持度计数:14
  频繁项:青壮年,四川省 支持度计数:16
  频繁项:青壮年,河北省 支持度计数:18
  频繁项:青壮年,湖南省 支持度计数:13
  频繁项:青壮年,福建省 支持度计数:12
  频繁项:青壮年,辽宁省 支持度计数:15
  频繁项:青壮年,江西省 支持度计数:39
  频繁项:青壮年,黑龙江省 支持度计数:16
  频繁项:青壮年,安徽省 支持度计数:68
  频繁项:青壮年,浙江省 支持度计数:35
  结合人群省份分布和青壮年省份分布可知,除了上海,其他省份读者主要是青壮年为主,分析其可能原因是其他年龄段读者由于地域限制很少来上海,或者即使在上海也很少前来图书馆。
  3 展望
  基于关联算法的图书馆读者行为分析方法研究,根据数据的种类和数量不同,可以有更多的分析討论。本文的讨论角度主要涉及方面:图书馆读者的基本情况包括省份、年龄段和性别分布的关联情况等。下一步可以进一步深入分析借阅册数、时间、违规情况、读者的详细信息等的关联关系研究。
  参考文献
  [1] 夏训明.我校多校区办学格局下师生对图书馆资源与服务的需求调查[J].广东药学院学报,2006,22 (5):573-578.
  [2] 罗志慧.高职院校图书馆服务质量与读者行为意愿研究[J].云教育.2014(3):21-21.
其他文献
[摘 要]本文根据黑龙江省防护体系建设现状,针对平原地区防护林生态建设提出了2点建议,供林业主管部门参考。  [关键词]黑龙江省;防护林体系建设;探讨  中图分类号:T65 文献标识码:A 文章编号:1009-914X(2017)28-0335-01  近几年来,随着黑龙江省六大林业生态工程的启动,防护林生态建设的速度不断加快,如何营造出高效、高质量防护林的课题也摆在了我们面前。结合笔者工作实践,
期刊
[摘 要]轨道交通很早就作为公共交通在城市中出现。起着越来越重要的作用。经济发达国家的交通发展历史告诉我们,采用高客运量的轨道交通客运组织可以从根本上改善城市公共交通状况。轨道交通客运组织是一个庞大而复杂的系统,承担着大城市客流的重要运输任务,因此,保障轨道交通客运的安全,加强轨道交通客运组织的有效管理,提高轨道交通部门应对突发事件的控制能力等是十分重要的。  [关键词]轨道交通;突发事件;处理措
期刊
[摘 要]园林绿化工程在面对日益加快的城市化进程时,对于提高城市环境,改善气候有着重要意义,同时,居民的生活质量也能得到提高。通过园林施工及养护管理实现整齐美观统一协调的效果,能够有效地提升园林工程的整体质量,促进城市生态环境的改善和城市形象的提升,逐步地改善城市环境。城市园林工程施工以及养护需要专业的技术支持,通过良好的技术支持来提高园林工程整体质量,达到美化城市环境的效果,所以对于园林施工及养
期刊
[摘 要]随着经济的发展,时代的进步。现在的人们越来越看重能源,对它的需求也是越来越大。然而,地球上的能源总量是有限的,所以我们在使用能源时不得不去提高效率。另外,在能源的使用过程中,一定要考虑到环境因素。因此,加大对热能动力联产系统节能的改革力度已经成为了重点工作之一。作者从该改革工作的理论角度出发,重点阐述了该改革方案中的主要内容。并且提出了热能动力联产系统节能改革的未来发展方向,即加大理论知
期刊
[摘 要]伴随科学技术的不断发展,推动着甚低频通信的逐渐进步,并且体现出了其抗干扰能力较低的缺陷。文本以为甚低频通信造成干扰的因素实施探讨为基石针对甚低频通信的抗干扰技术进行研究,借此确保甚低频通信的可靠性与平稳性,以推动甚低频通信又好又快的发展。  [关键词]甚低频通信;抗干扰技术;发展  中图分类号:TM 文献标识码:A 文章编号:1009-914X(2017)28-0344-01  1 前言
期刊
[摘 要]目前,劳务工人还游离在企业人力资源之外,工匠的培养、晋升的通道、文化的塑造等等,都遇到了“天花板”,同时,作为国企,在人口红利加速消失、劳务市场供求关系发生逆转、新一代就业观已经变化的大背景下,施工企业必须转变观念,将劳务上升为企业重要的人力资源,甚至作为企业的核心竞争力去看待。只有两者实现深度融合,企业才能真正走出“结构性矛盾”的困境。本文就从企业项目基层入手,细处着笔,说明劳务工人已
期刊
[摘 要]随着我国经济的发展,我国的测绘工程也得到了显著的应用发展,并且测绘工作对保障建筑设施的安全具有重要的作用。但是测绘工作具有双重性质,在测绘正确规范的基础之上,可以为房屋建设、土地规划提供有力的信息指导,但是一旦测绘工作产生疏漏同样也会对工程的建筑质量产生严重的影响,为此,社会各界对测绘工程质量提出了严格的要求,为了响应社会的号召,测绘部门应该及时的调整策略实现企业的可持续发展战略。本文针
期刊
[摘 要]随着城市化进程的不断加快,城市的轨道交通也在不断的发展变化,为适应发展趋势,城市的轨道交通信号也必须时刻保持正常工作状态。然而由于老化等问题,使得信号设备不断出现问题。为此相关部门必须加大力度进行检修。本文将重点论述交通信号在不同时期的检修方式。  [关键词]轨道交通;信号设备;检修模式  中图分类号:F0 文献标识码:A 文章编号:1009-914X(2017)28-0351-01  
期刊
[摘 要]为确保动车组运用检修安全、高效、有序进行,建立并落实领导统一、职责明确、分工负责又协调联动的动车组运用检修一体化管理要求,保证动车组运用、检修质量,确保高铁和旅客安全,于2016年12月开始,对武汉铁路局涉及动车组一体化管理的16个路内单位和7个路外单位进行了跟踪检查调研。  [关键词]武汉铁路;检修;一体化  中图分类号:F10 文献标识码:A 文章编号:1009-914X(2017)
期刊
[摘 要]随着我国城市轨道交通的高速发展,很多大中型城市都建立了自己的地铁交通网,轨道交通的运营方式从单线独立运营逐步向多线综合运营模式转变,轨道交通网络的结构日益复杂,地上和地下轨道交通连为一体,不同交通线路运行方式与多元化,以及客流分布的时空差异等各种因素都加大了地铁运营管理的难度,实行网络化行车组织与运营成为眼下做好地铁运营工作的发展出路。  [关键词]地铁网络化;行车组织;问题;运营协调 
期刊