论文部分内容阅读
〔摘 要〕读者细分是图书馆管理中迫切需要解决的问题,“被动服务”的图书馆服务模式逐渐转向“读者驱动”,所提供的个性化服务应该符合读者的实际需求,因此这种个性化服务对于目前单一的读者属性细分方式提出了更高的要求。本文采用系统聚类算法建立了图书馆读者细分模型,进而提出了四种不同的细分方式,并用图书馆流通数据对模型进行了测试,验证了该细分模型的实用性和有效性。
〔关键词〕图书馆流通;个性化服 务;系统聚类算法;读者细分模型
〔中图分类号〕G252 〔文献标识码〕C 〔文章编号〕1008-0821(2009)09-0158-04
A Segmentation Model of Library Reader Based on System Clustering AlgorithmNie Zhen
(Library,Chongqing University of Technology,Chongqing 400050,China)
〔Abstract〕Reader segmentation is an imperative problem to the library management.L ibrary services mode characterized by“passive service”has gradually transforme d to“reader-driven”,which requires to provide personalized service solution inaccordance with the actual needs of the readers.So personalized service put uphigher requirements for the current single property division of readers.This pap er adopted system clustering algorithm to set up a reader segmentation model oflibrary,further presented four different division methods.After the model was te sted by a large number of realistic library circulation data,the practicality an d validation of the model was proved.
〔Key words〕library circulation;personalized service;system cluster algorithm;reader segmentation model
图书馆作为服务型行业,对读者需求和读者特点的深刻把握才是提高服务质量的关键,作为分析读者方法的读者细分已成为图书馆管理中重要的工具,主要是指图书馆在明确的战略和服务模式下,根据读者的需求和偏好等综合因素对于读者进行分类,对不同的读者群提供具有个性化的图书借阅服务模式,其优点主要表现在以下几个方面:
(1)读者细分是读者管理的基础:当前管理者应该对其最宝贵的读者资源进行精细化管理,比如根据读者的价值对其进行分级管理、为图书借阅率不同的读者设定不同的借阅时限、为书籍阅读模式和阅读能力不同的读者设计不同的新书推荐等。读者管理越来越成为图书馆管理者的核心和主线,而识别新读者、提升现有读者价值以及对读者流失倾向的察觉等方面都需要建立在对读者细分的基础上。
(2)读者细分可以增强图书借阅服务的针对性:通过读者细分发掘读者对服务的特定需求,从而提供个性化的服务,使管理者在流通服务日趋同质化的今天获得读者的青睐。除了图书流通服务外,读者对管理人员服务质量的感受还来源于接受服务的所有接触点上,比如电子书籍服务、期刊借阅厅和外文借阅厅。
(3)图书借阅服务创新取决于管理人员细分读者的能力:图书借阅业务创新能够为图书馆管理创造新的借阅量增长点、提高资源利用率降低管理成本、满足读者需求。而只有通过准确的读者细分把握读者需求的差异性,图书馆管理者才能根据读者的特定需求开发出“以人为本”的新业务。由于读者细分能够揭示新业务读者群体的借阅水平,有利于图书馆在业务创新时更有效地控制管理成本。此外图书馆通过读者细分能够发掘某一读者群体的潜在需求,根据这一读者群体的需求特征设计出独具特色的图书借阅业务,因此读者细分有助于图书馆挖掘书籍流通中被忽略处,通过借阅差异化建立起服务优势,从而提升自身的竞争力。
本文根据图书馆读者服务需求,分析了图书馆读者细分模型,对模型体系结构、模型数据准备、模型挖掘算法、模型样本库生成等步骤进行了阐述,另外对模型在图书馆中的应用也做了详细的介绍。
1 模型的体系结构
根据图书馆流通的特性,本文将读者细分模型分为数据获取、数据存储和数据访问三层。读者细分的基础是对读者的信息和资料进行收集和整理,通过比较找出他们之间的差异,然后对其进行分类。如图1所示:图1 模型体系结构
数据应用层:对数据仓库市中数据进行分析和聚类,建立读者细分模型,形成图书馆管理和决策工作所需的读者细分信息。
数据存储层:实现对图书馆业务数据仓库中数据和元数据的集中存储与管理,并可根据需求建立面向图书馆流通部门主题的数据仓库。
数据获取层:将图书馆流通部日常借阅数据进行抽取、清洗、转换,并加载到数据仓库。
2009年9月第29卷第9期现?代?情?报Journal of Modern InformationSep.,2009Vol.29 No.92009年9月第29卷第9期一种基于系统聚类的图书馆读者细分模型Sep.,2009Vol.29 No.92 模型的系统聚类算法
根据图书馆流通性质,要进行读者细分就需要根据读者属性划分读者集合,这就需要对样本进行聚类分析,本文采用统计学聚类分析中最为广泛的系统聚类法。下面介绍系统聚类法的基本原理:
(1)将n个样本或指标各自看成一类,得到n个类;
(2)计算样本(或指标)之间的亲疏程度,也就是它们的距离;
(3)将亲疏程度最高(即距离最近)的两类合并为一类,形成一个新的类。
(4)考虑合并后的类与其他类之间的亲疏程度,再进行合并。重复这一过程,经过n-1次合并后,所有的样本(或指标)成为一类。
(5)聚类图,将上述合并的全部聚类过程用直观图画出。
(6)决定类的个数,并由上述步骤得到相应的聚类分析结果。
下面介绍系统聚类法的基本步骤:
第一步:规定距离(欧氏距离),计算各样本两两距离,并记载在分类距离对称表中。记为D(0),这就是第0步的表,每个样本为一类。duv表示两个样本之间的距离,Duv表示每两个类之间的距离。
第二步:选择其中的最短距离,设为Duv,则将Gu和Gv合并成一个新类,记为Gr,Gr={Gu,Gv}。这就是Gr类,表示由Gu类和Gv类组成。
第三步:计算新类Gr与其他类之间的距离,定义
Drk=mini∈Grj∈Gk{dij}=minmini∈Guj∈Gkdij,mini∈Gvj∈Gkdij
实际上是判断Duk和Drk的大小,将小的距离作为新类Dr和Dk之间的距离。
第四步:作D(1)表,将D(0)中的第u,v行第u,v列删去,加第r行r列,第r行r列元素为Dr与其它类的距离,这样得到一个新的距离对称表,记为D(1)表,表示经过一次聚类后的距离表,D(1)表下注明Dr是包含哪两类。
第五步:对D(1)按从第二到第四步的步骤重复类似D(0)的聚类工作,可以得到D(2)表,这就是经过二次聚类得到的一个新的分类距离对称表。
第六步:重复聚类,直到最后只剩下两个类为止。
在这个方法的实施步骤中,类与类之间的距离计算是非常重要的,也就是如何定义类与类之间的亲疏程度,本文采用聚类分析中最常用的欧氏距离。
3 读者细分模型的建立
3.1 读者细分的数据模型
首先要在建立细分模型之前,根据图书馆流通性质找出影响读者细分模型的属性字段,建立读者细分的数据模型。然后建立数据模型,就需进行数据抽样,采取分层随机抽样的方法从读者基本信息表(readerinfo.mdf)中抽取1 500个样本,形成读者样本库存放于表readerinfosample.mdf中,根据读者编号,从读者详细借阅表(borrowdetail.mdf)、读者借阅汇总表(borrowsum.mdf)、读者借阅均值表(avgborrowsum.mdf)中提取读者相关数据。图2 数据预处理流程图
最后,数据统一汇到一张表readerborrowdetail中,作为读者细分的数据模型,其sql语句如下:
CREATE TABLE[dbo].[readerborrowdetail](
[readerid][decimal](10,0)NOT NULL,
[readername][varchar](16)NOT NULL,
[telnumber][varchar](16)NOT NULL,
[readerdepartment][varchar](20)NULL,
[readerage][varchar](10)NULL,
[readermark][varchar](20)NULL,
[totalborrow][decimal](16,2)NULL,
[monthborrow][decimal](16,2)NULL,
[cultrueborrow][decimal](16,2)NULL,
[noncultrueborrow][decimal](16,2)NULL,
[avgtotalborrow][decimal](16,2)NULL,
[avgmonthborrow][decimal](16,2)NULL,
[avgcultrueborrow][decimal](16,2)NULL,
[avgnoncultrueborrow][decimal](16,2)NULL
)ON[PRIMARY]
3.2 读者细分模型的建立
单一的读者属性划分方式很难满足图书馆管理和决策工作的需要,本文从不同的角度全方位地对读者属性进行划分,以满足图书馆经营者和管理决策者的不同需求。从图书馆流通的需求来看,由于年龄、专业、受教育程度等方面的不同,读者对图书馆流通的需求呈现多层次、个性化、差异化的趋势,具体划分如下:
3.2.1 按读者借阅类型构成比例划分的细分
第一步:选取细分变量avgmonthborrow/avgtotalborrow、avgcultrueborrow/avgtotalborrow、avgnoncultrueborrow/avgtotalborrow。
第二步:用系统聚类法对1 000个用户聚类。
第三步:将avgmonthborrow/avgtotalborrow、avgcultrueborrow/avgtotalborrow、avgnoncultrueborrow/avgtotalborrow作为模型的输入,第二步得出的聚类结果作为模型输出。
第四步:模型的应用,输入任意个用户的字段值,用第二步得出的聚类模型进行计算,得到期望的细分结果。
3.2.2 按读者专业对借阅量贡献细分
第一步:选取细分变量readerdepartment、readermark、avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow,根据图书馆信息部提供的数据,字段readerdepartment的可选值为:数理学院、经济与贸易学院、计算机科学与工程学院、汽车学院、人文社会科学学院、会计学院、电子信息与自动化学院、工商管理学院、材料科学与工程学院、外国语学院、化学与生物工程学院、体育教学部、成人教育学院、应用技术学院、商贸信息学院、知识产权学院。字段readermark的可选值:学生、教师、职工。
第二步:将readerdepartment与readermark组合成5类,每一类的avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow的值进行聚类,得出的聚类结果作为模型的输出。
第三步:模型的应用,输入任意个用户的字段值,用第二步得出的聚类模型进行计算,得到期望的细分结果。
3.2.3 按读者借阅类型构成细分
第一步:选取细分变量avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow,单位:次。
第二步:用系统聚类法对1000个用户进行聚类。
第三步:将avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow作为模型的输入,第二步得出的聚类结果作为模型输出。
第四步:模型的应用,输入任意个用户的字段值,用第二步得出的聚类模型进行计算,得到期望的细分结果。
3.2.4 按读者年龄对借阅量贡献细分
第一步:选取细分变量readerage、readermark、avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow,根据图书馆提供的数据,字段readerage的可选值为:20岁以下的用户;20到30岁之间的用户;30岁以上的用户。字段readermark的可选值:学生、教师、职工。
第二步:将readerage与readermark组合成5类,每一类的avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow的值进行聚类,得出的聚类结果作为模型的输出。用系统聚类法对1000个用户聚类得出模型。
第三步:模型的应用,输入任意个用户的字段值,用第二步得出的聚类模型进行计算,得到期望的细分结果。
4 图书馆读者细分模型的应用
本文建立模型以后,通过图书馆所提供的大量的现实数据加以验证,测试该模型的有效性和实用性。以“读者专业对借阅量贡献细分”为例,模型细分结果如下所示。图3 图书馆读者细分模型特征对话框
图4 图书馆读者细分模型特征图
图5 分类特征图(按借阅总量划分)
可以看到,对于不同的划分方式得到了五类读者,结果显示了每一类读者所占的比例和人数以及这一类读者所具有的特征,每一类之间具有显著的差异和不同的特性,类间没有重复和交叉,这验证了细分模型的合理性,可以满足图书馆管理决策者对读者的不同细分需求。
5 结 论
本文利用数据挖掘聚类方法中的系统聚类算法设计了相应的体系构架,结合重庆理工大学图书馆读者借阅业务需求,建立了图书馆读者细分模型。通过该校图书馆所提供的大量的现实数据的训练,得到的细分结果验证了模型的合理性和实用性,为图书馆服务和决策提供了有力的技术支持。考虑到读者细分是随着时间推移相对变化的,不同时期的读者借阅特点有可能会发生变化,因此图书馆管理者应该随时关注读者的变化,对其读者细分模型策略进行调整。
参考文献
[1]宋琼.论信息网络环境下高校图书馆读者服务创新之根本[J].现代情报,2008,28(4):85-86.
[2]刘静春,余玲.数字图书馆中读者偏好智能分析系统[J].情报杂志,2008,27(5):107-109.
[3]刘勇,徐双.基于读者知识的图书馆读者服务创新[J].图书馆论坛,2008,28(3):114-116.
[4]张兵.从读者分层论视角看图书馆服务热点[J].高校图书馆工作,2008,(6):74-76.
[5]严京生.基于MBR技术的图书馆读者群构建及研究[J].现代情报,2007,27(11):14-17.
[6]罗仕健,朱光磊.网络环境下数据挖掘技术在图书馆中的应用[J].情报杂志,2004,(6):22-24.
[7]辛艳玲.关注读者群变化做好针对性服务[J].图书馆界,2007,(6):19-21.
[8]Jiawei Han,Micheline Kamb.Data Mining-Concept and Techniques[M].北京:机械工业出版社,2007:162-168.
〔关键词〕图书馆流通;个性化服 务;系统聚类算法;读者细分模型
〔中图分类号〕G252 〔文献标识码〕C 〔文章编号〕1008-0821(2009)09-0158-04
A Segmentation Model of Library Reader Based on System Clustering AlgorithmNie Zhen
(Library,Chongqing University of Technology,Chongqing 400050,China)
〔Abstract〕Reader segmentation is an imperative problem to the library management.L ibrary services mode characterized by“passive service”has gradually transforme d to“reader-driven”,which requires to provide personalized service solution inaccordance with the actual needs of the readers.So personalized service put uphigher requirements for the current single property division of readers.This pap er adopted system clustering algorithm to set up a reader segmentation model oflibrary,further presented four different division methods.After the model was te sted by a large number of realistic library circulation data,the practicality an d validation of the model was proved.
〔Key words〕library circulation;personalized service;system cluster algorithm;reader segmentation model
图书馆作为服务型行业,对读者需求和读者特点的深刻把握才是提高服务质量的关键,作为分析读者方法的读者细分已成为图书馆管理中重要的工具,主要是指图书馆在明确的战略和服务模式下,根据读者的需求和偏好等综合因素对于读者进行分类,对不同的读者群提供具有个性化的图书借阅服务模式,其优点主要表现在以下几个方面:
(1)读者细分是读者管理的基础:当前管理者应该对其最宝贵的读者资源进行精细化管理,比如根据读者的价值对其进行分级管理、为图书借阅率不同的读者设定不同的借阅时限、为书籍阅读模式和阅读能力不同的读者设计不同的新书推荐等。读者管理越来越成为图书馆管理者的核心和主线,而识别新读者、提升现有读者价值以及对读者流失倾向的察觉等方面都需要建立在对读者细分的基础上。
(2)读者细分可以增强图书借阅服务的针对性:通过读者细分发掘读者对服务的特定需求,从而提供个性化的服务,使管理者在流通服务日趋同质化的今天获得读者的青睐。除了图书流通服务外,读者对管理人员服务质量的感受还来源于接受服务的所有接触点上,比如电子书籍服务、期刊借阅厅和外文借阅厅。
(3)图书借阅服务创新取决于管理人员细分读者的能力:图书借阅业务创新能够为图书馆管理创造新的借阅量增长点、提高资源利用率降低管理成本、满足读者需求。而只有通过准确的读者细分把握读者需求的差异性,图书馆管理者才能根据读者的特定需求开发出“以人为本”的新业务。由于读者细分能够揭示新业务读者群体的借阅水平,有利于图书馆在业务创新时更有效地控制管理成本。此外图书馆通过读者细分能够发掘某一读者群体的潜在需求,根据这一读者群体的需求特征设计出独具特色的图书借阅业务,因此读者细分有助于图书馆挖掘书籍流通中被忽略处,通过借阅差异化建立起服务优势,从而提升自身的竞争力。
本文根据图书馆读者服务需求,分析了图书馆读者细分模型,对模型体系结构、模型数据准备、模型挖掘算法、模型样本库生成等步骤进行了阐述,另外对模型在图书馆中的应用也做了详细的介绍。
1 模型的体系结构
根据图书馆流通的特性,本文将读者细分模型分为数据获取、数据存储和数据访问三层。读者细分的基础是对读者的信息和资料进行收集和整理,通过比较找出他们之间的差异,然后对其进行分类。如图1所示:图1 模型体系结构
数据应用层:对数据仓库市中数据进行分析和聚类,建立读者细分模型,形成图书馆管理和决策工作所需的读者细分信息。
数据存储层:实现对图书馆业务数据仓库中数据和元数据的集中存储与管理,并可根据需求建立面向图书馆流通部门主题的数据仓库。
数据获取层:将图书馆流通部日常借阅数据进行抽取、清洗、转换,并加载到数据仓库。
2009年9月第29卷第9期现?代?情?报Journal of Modern InformationSep.,2009Vol.29 No.92009年9月第29卷第9期一种基于系统聚类的图书馆读者细分模型Sep.,2009Vol.29 No.92 模型的系统聚类算法
根据图书馆流通性质,要进行读者细分就需要根据读者属性划分读者集合,这就需要对样本进行聚类分析,本文采用统计学聚类分析中最为广泛的系统聚类法。下面介绍系统聚类法的基本原理:
(1)将n个样本或指标各自看成一类,得到n个类;
(2)计算样本(或指标)之间的亲疏程度,也就是它们的距离;
(3)将亲疏程度最高(即距离最近)的两类合并为一类,形成一个新的类。
(4)考虑合并后的类与其他类之间的亲疏程度,再进行合并。重复这一过程,经过n-1次合并后,所有的样本(或指标)成为一类。
(5)聚类图,将上述合并的全部聚类过程用直观图画出。
(6)决定类的个数,并由上述步骤得到相应的聚类分析结果。
下面介绍系统聚类法的基本步骤:
第一步:规定距离(欧氏距离),计算各样本两两距离,并记载在分类距离对称表中。记为D(0),这就是第0步的表,每个样本为一类。duv表示两个样本之间的距离,Duv表示每两个类之间的距离。
第二步:选择其中的最短距离,设为Duv,则将Gu和Gv合并成一个新类,记为Gr,Gr={Gu,Gv}。这就是Gr类,表示由Gu类和Gv类组成。
第三步:计算新类Gr与其他类之间的距离,定义
Drk=mini∈Grj∈Gk{dij}=minmini∈Guj∈Gkdij,mini∈Gvj∈Gkdij
实际上是判断Duk和Drk的大小,将小的距离作为新类Dr和Dk之间的距离。
第四步:作D(1)表,将D(0)中的第u,v行第u,v列删去,加第r行r列,第r行r列元素为Dr与其它类的距离,这样得到一个新的距离对称表,记为D(1)表,表示经过一次聚类后的距离表,D(1)表下注明Dr是包含哪两类。
第五步:对D(1)按从第二到第四步的步骤重复类似D(0)的聚类工作,可以得到D(2)表,这就是经过二次聚类得到的一个新的分类距离对称表。
第六步:重复聚类,直到最后只剩下两个类为止。
在这个方法的实施步骤中,类与类之间的距离计算是非常重要的,也就是如何定义类与类之间的亲疏程度,本文采用聚类分析中最常用的欧氏距离。
3 读者细分模型的建立
3.1 读者细分的数据模型
首先要在建立细分模型之前,根据图书馆流通性质找出影响读者细分模型的属性字段,建立读者细分的数据模型。然后建立数据模型,就需进行数据抽样,采取分层随机抽样的方法从读者基本信息表(readerinfo.mdf)中抽取1 500个样本,形成读者样本库存放于表readerinfosample.mdf中,根据读者编号,从读者详细借阅表(borrowdetail.mdf)、读者借阅汇总表(borrowsum.mdf)、读者借阅均值表(avgborrowsum.mdf)中提取读者相关数据。图2 数据预处理流程图
最后,数据统一汇到一张表readerborrowdetail中,作为读者细分的数据模型,其sql语句如下:
CREATE TABLE[dbo].[readerborrowdetail](
[readerid][decimal](10,0)NOT NULL,
[readername][varchar](16)NOT NULL,
[telnumber][varchar](16)NOT NULL,
[readerdepartment][varchar](20)NULL,
[readerage][varchar](10)NULL,
[readermark][varchar](20)NULL,
[totalborrow][decimal](16,2)NULL,
[monthborrow][decimal](16,2)NULL,
[cultrueborrow][decimal](16,2)NULL,
[noncultrueborrow][decimal](16,2)NULL,
[avgtotalborrow][decimal](16,2)NULL,
[avgmonthborrow][decimal](16,2)NULL,
[avgcultrueborrow][decimal](16,2)NULL,
[avgnoncultrueborrow][decimal](16,2)NULL
)ON[PRIMARY]
3.2 读者细分模型的建立
单一的读者属性划分方式很难满足图书馆管理和决策工作的需要,本文从不同的角度全方位地对读者属性进行划分,以满足图书馆经营者和管理决策者的不同需求。从图书馆流通的需求来看,由于年龄、专业、受教育程度等方面的不同,读者对图书馆流通的需求呈现多层次、个性化、差异化的趋势,具体划分如下:
3.2.1 按读者借阅类型构成比例划分的细分
第一步:选取细分变量avgmonthborrow/avgtotalborrow、avgcultrueborrow/avgtotalborrow、avgnoncultrueborrow/avgtotalborrow。
第二步:用系统聚类法对1 000个用户聚类。
第三步:将avgmonthborrow/avgtotalborrow、avgcultrueborrow/avgtotalborrow、avgnoncultrueborrow/avgtotalborrow作为模型的输入,第二步得出的聚类结果作为模型输出。
第四步:模型的应用,输入任意个用户的字段值,用第二步得出的聚类模型进行计算,得到期望的细分结果。
3.2.2 按读者专业对借阅量贡献细分
第一步:选取细分变量readerdepartment、readermark、avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow,根据图书馆信息部提供的数据,字段readerdepartment的可选值为:数理学院、经济与贸易学院、计算机科学与工程学院、汽车学院、人文社会科学学院、会计学院、电子信息与自动化学院、工商管理学院、材料科学与工程学院、外国语学院、化学与生物工程学院、体育教学部、成人教育学院、应用技术学院、商贸信息学院、知识产权学院。字段readermark的可选值:学生、教师、职工。
第二步:将readerdepartment与readermark组合成5类,每一类的avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow的值进行聚类,得出的聚类结果作为模型的输出。
第三步:模型的应用,输入任意个用户的字段值,用第二步得出的聚类模型进行计算,得到期望的细分结果。
3.2.3 按读者借阅类型构成细分
第一步:选取细分变量avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow,单位:次。
第二步:用系统聚类法对1000个用户进行聚类。
第三步:将avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow作为模型的输入,第二步得出的聚类结果作为模型输出。
第四步:模型的应用,输入任意个用户的字段值,用第二步得出的聚类模型进行计算,得到期望的细分结果。
3.2.4 按读者年龄对借阅量贡献细分
第一步:选取细分变量readerage、readermark、avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow,根据图书馆提供的数据,字段readerage的可选值为:20岁以下的用户;20到30岁之间的用户;30岁以上的用户。字段readermark的可选值:学生、教师、职工。
第二步:将readerage与readermark组合成5类,每一类的avgtotalborrow、avgmonthborrow、avgcultrueborrow、avgnoncultrueborrow的值进行聚类,得出的聚类结果作为模型的输出。用系统聚类法对1000个用户聚类得出模型。
第三步:模型的应用,输入任意个用户的字段值,用第二步得出的聚类模型进行计算,得到期望的细分结果。
4 图书馆读者细分模型的应用
本文建立模型以后,通过图书馆所提供的大量的现实数据加以验证,测试该模型的有效性和实用性。以“读者专业对借阅量贡献细分”为例,模型细分结果如下所示。图3 图书馆读者细分模型特征对话框
图4 图书馆读者细分模型特征图
图5 分类特征图(按借阅总量划分)
可以看到,对于不同的划分方式得到了五类读者,结果显示了每一类读者所占的比例和人数以及这一类读者所具有的特征,每一类之间具有显著的差异和不同的特性,类间没有重复和交叉,这验证了细分模型的合理性,可以满足图书馆管理决策者对读者的不同细分需求。
5 结 论
本文利用数据挖掘聚类方法中的系统聚类算法设计了相应的体系构架,结合重庆理工大学图书馆读者借阅业务需求,建立了图书馆读者细分模型。通过该校图书馆所提供的大量的现实数据的训练,得到的细分结果验证了模型的合理性和实用性,为图书馆服务和决策提供了有力的技术支持。考虑到读者细分是随着时间推移相对变化的,不同时期的读者借阅特点有可能会发生变化,因此图书馆管理者应该随时关注读者的变化,对其读者细分模型策略进行调整。
参考文献
[1]宋琼.论信息网络环境下高校图书馆读者服务创新之根本[J].现代情报,2008,28(4):85-86.
[2]刘静春,余玲.数字图书馆中读者偏好智能分析系统[J].情报杂志,2008,27(5):107-109.
[3]刘勇,徐双.基于读者知识的图书馆读者服务创新[J].图书馆论坛,2008,28(3):114-116.
[4]张兵.从读者分层论视角看图书馆服务热点[J].高校图书馆工作,2008,(6):74-76.
[5]严京生.基于MBR技术的图书馆读者群构建及研究[J].现代情报,2007,27(11):14-17.
[6]罗仕健,朱光磊.网络环境下数据挖掘技术在图书馆中的应用[J].情报杂志,2004,(6):22-24.
[7]辛艳玲.关注读者群变化做好针对性服务[J].图书馆界,2007,(6):19-21.
[8]Jiawei Han,Micheline Kamb.Data Mining-Concept and Techniques[M].北京:机械工业出版社,2007:162-168.