论文部分内容阅读
从纸本文献到电子资源,从孤立的馆舍到广泛互联融合共享,图书馆越来越成为汇聚大数据的场所。图书馆不仅自身累积了大量数据及其副本,而且数字图书馆的发展也催生越来越丰富的线上资源,特别是馆际互借与文献传递功能使图书馆之间可以相互贯通融合不再是数据孤岛,与博物馆、档案馆的资源整合更是拓展了图书馆的边界。另一方面,开放存取知识库与搜索引擎同样也提供了庞大、便捷的信息资源,在学术研究中扮演着日益重要的角色。此外,图书馆与读者之间的互动数据(借阅行为记录、读者检索信息、网站访问等),也都是典型大数据(机器自动记录数据)的产生来源,丰富了图书馆数据源的种类,提供了知识服务拓展的可能性。然而这部分互动记录数据往往被封存于软件之中,只露汇总统计冰山一角。本文从微观需求面切入,结合问卷调查数据与借阅行为记录,通过不同数据来源的交叉验证,分析图书馆资源的使用效率及其结构,探讨研究生群体的借阅行为特征,研究影响图书馆资源利用的主要因素,并提出切实建议。本文以对图书馆利用率较高的研究生作为实证样本,其中,问卷调查共发放问卷600份,为所计算的最大样本量,利用硕士类型、年级、学院的分层三阶段PPS随机抽样,回收有效问卷526份,问卷回收率为87.7%;借阅行为记录共抽取我校在读硕士研究生总数的1/10,最终获取样本量为262人。调查实施过程中,我们采用以下方式保证较高的调查精度:1.制定详细周全的调查计划并严格执行;2.执行预调查规避调查风险;3.问卷设计通过信度效度检验确保内容的一致性和有效性;4.分层三阶段PPS抽样法保证随机性。数据采集方面,考虑"兼听则明",因此采用借阅行为记录与问卷调查数据相融合的方式获取样本数据。数据清洗方面,问卷采集数据不仅考虑了多选题的组合问题,同时对于多选排序题,我们采用排序赋权的方式将定类数据转化为定量数据,并将借阅行为记录处理为适用于用户行为挖掘分析的购物篮式数据。数据分析方面,运用方差分析、列联分析、非参数检验等基础统计分析方法,并结合广义线性混合模型科学评价图书馆资源利用的统计特征。得到的主要结论有:1.相比于电子资源和搜索引擎等开放资源,纸质资源仍是读者的优先选择。此外,研究生对网络搜索引擎的依赖程度可能并不高,只是他们在对待搜索引擎的态度上存在较大差异。2.纸质图书的流通在绝对量上依然占优,但是借阅行为记录显示,2005-2014年纸质图书的借阅率整体呈下降趋势(这可能源于近年来网络化、电子化资源的发展和人们阅读方式的转变等多种因素的影响)。尽管借阅率(名义使用效率)有所下降,但是进一步结合问卷调查数据考察图书借阅之后的实际使用效率,发现仅有2.7%的读者将借来的书束之高阁不曾翻阅,说明图书借阅之后的实际使用效率还是比较高的。3.电子资源的使用障碍主要体现在检索技巧上,其次是网络拥挤、原文获取等问题。相比出于借阅图书的目的而去图书馆的学生,出于多媒体浏览的目的而去图书馆的学生对图书馆电子资源的使用效果更好。4.关于图书馆扮演何种角色的调查,我们发现一个有趣的现象。整体来看,大家认为图书馆学习氛围好、适合学习,同时藏书丰富,还可以上网娱乐休息,但是在"接触异性"和"请教他人"两个选项上存在显著的性别差异。进一步,数学与数量经济学院的研究生最常去图书馆,女生相比男生更常去图书馆,学术型硕士相比专业型硕士更常去图书馆,有过实习或工作经历的研究生借书更显积极主动。此外,去图书馆的主要目的并不是借阅图书和查找资料(29.66%)而是为了上自习(64.64%),为参加讲座或图书活动和其他原因去图书馆的研究生占比不足1%。5.图书借阅隐约遵循"二八原则",即,借阅率排在前三位的图书类别支撑了 70%以上的借阅流通,而大部分图书类别却乏人问津。为改善借阅率较低的图书类别的流通效率,同时拓展学生的阅读范围和专业广度,本文采用关联规则探索了图书类别之间的关联性。