论文部分内容阅读
〔摘要〕[目的/意义]高校图书馆为了掌握读者信息需求动态数据。[方法/过程]利用帆布指纹识别与CNZZ两种方法进行读者信息追踪,获取读者信息行为,在法律与道德允许范围内,从获取的数据中挖掘读者需求信息。通过对高校读者的信息行为的特征需求分析,匹配与图书馆拥有的信息资源并通过网络平台推送至读者。[结果/结论]借助于智能推荐系统,能够促进服务由粗放化向精细化转变,用以提高图书馆智能化服务水平。
〔关键词〕帆布指纹识别;读者行为追踪;高校图书馆;智能化服务;CNZZ
DOI:10.3969/j.issn.1008-0821.2016.07.019
〔中图分类号〕G2507〔文献标识码〕A〔文章编号〕1008-0821(2016)07-0107-06
1研究背景
在图书馆服务工作中提出的智能化信息服务也可以称为个性化信息服务,主要是指在互联网环境下,动态掌握读者信息需求的数据,以此为基础进行数据挖掘,推送图书馆拥有的相关资源信息至读者的过程。例如汇文管理系统的馆藏数目查询系统中,可以提供热门图书等信息,就是根据读者的借阅量与检索行为等数据分析出来的结果。高校图书馆追踪读者的信息行为的条件比较成熟,首先,高校图书馆网络环境处于校园网中,资源尤其是数字资源的访问受到一定的限制,如IP地址等。其次,高校用户通过网络访问需要进行认证,最后,高校读者在图书馆以及校园网络中,有较为详细的信息,如部门、学历、邮箱等。所以在高校范围之内进行针对读者的信息追踪,具有一定的理论与实践基础。读者由于自身的原因,如学科背景、研究偏好等,对于资源的内容和要求也不尽相同。图书馆需要建立一套针对读者信息的需求系统,用以追踪读者日益增长的信息需求动态信息行为。智能化信息服务实现的基础就是追踪获取读者信息需求数据,在掌握读者需求数据的基础上才能够实现读者服务的针对性、主动性、连续性、专业性与易用性的特点,也能够间接地提高读者对高校图书馆信息服务的满意度[1]。互联网的普及拓展了资源获取的途径,互联网内容不断丰富也增加了信息的总量,也促使图书馆的服务模式由信息服务向知识管理服务转变。在电子商务网站为主体的网络服务商急需一种新的信息服务的模式,用以满足用户的不断增长同时也不断变化的需求。智能化服务是网络信息社会的基本特征之一[2],只有不断改变信息服务模式,满足并适应不同用户群体的不同需求,才能够在竞争激烈的信息环境下表现出顽强的生命力。广告联盟和电子商务网站都希望准确定位,通过对用户行为进行分析,如浏览页面、下载内容、检索主题等,为用户推送更加精准的广告,同时可以通过对用户的标识,可以将不同站点的用户进行关联[3-4]。高校图书馆在信息服务工作中,也需要尝试着一些方法获取读者的资源访问信息,例如设计并实现了数字资源统计分析系统,实时掌握读者利用馆内数字资源情况[5-8]。利用CNZZ[9]的站长统计的功能对读者访问图书馆网站情况进行统计分析[10]。随着信息技术的不断发展,高校图书馆的智能化服务也逐步借鉴商业网络成熟的技术经验与案例,用以实施与部署自身资源服务。例如利用微信公共号平台建设微信图书馆[11]。部分图书馆和学者运用网络监控方法搜集读者的资源访问数据,用以评估指导数字资源建设。在信息技术引领着高校图书馆资源建设与学科服务发展的环境下,由于高校读者群体相对稳定,可以通过信息追踪的方式获取读者需求的动态信息,同时对收集的信息进行分类,并挖掘读者需求数据,将结果利用在智能化服务中,用以提升了服务的效率,降低了资源建设成本,达到智能化和精细化服务的目的。
2理论基础与技术关键
21精细化服务
在经济管理领域,经常提倡在管理以及经济建设过程中,需要由粗放型向精细化建设转变。而图书馆历年来思路也在不断转变,也由过去的粗放型的资源建设和读者服务向精细化的目的性服务转变。例如在资源建设过程中,引入读者参与推荐购买资源模式等。读者服务过程中,设置意见渠道,时刻掌握读者反馈的意见和建议,逐一调整服务工作中存在的问题与不足。而粗放型逐步转变成精细化的主要中心思想是以读者为中心,建立一套服务读者的信息资源保障体系,是未来图书馆智能化与人性化建设的中心内容。
22帆布指纹识别
互联网用户逐渐对个人隐私的重视,通过Cookie收集用户的信息方法其可靠性逐渐降低。不少安全工具甚至是浏览器都开始允许或引导用户关闭Cookie功能,例如很多主流浏览器都有一个“隐私模式浏览”功能。因此网站无法对访客进行追踪。但是有一些特例如通过Flash Cookie的方式也可以达到惟一标识和追踪的目的。2013年开始国外媒体报道了一种非常难以摆脱的新型在线追踪工具被用来追踪白宫等热门网站的访问者。这就是一种比较新的访客追踪技术:“帆布指纹识别”技术。这个技术的优势在于不像通过Cookie或者Flash Cookie等之类的方式,网络访客无法屏蔽。图书馆的网络平台模式主要是以图书馆的门户为基础,移动服务端等多平台并存的组合形成图书馆信息服务保障系统。掌握访问用户的信息行为也是未来图书馆所需要追踪的信息行为内容之一。
23CNZZ站长统计
目前国内站长使用最多的网站流量系统,为网站提供安全、可靠、公正的第三方网站访问免费统计,是一个针对目的网站的流量统计分析工具。通过CNZZ站长统计[12],网站管理员可以随时知道管理的网站的被访问情况,例如访问人次、访问网页、新访客的来源地点、网站的用户的地区分布等非常有价值的信息数据。管理员可以根据CNZZ站长统计,可以动态掌握网站的访问情况,及时调整自己的页面内容,推广方式,以及对目的网站的调整做出客观公正的评测。同时CNZZ站长统计已经被业内公认为是一个可信赖的第三方评判标准,发生网站访问流量方面的疑问时,业界相关人员都愿意以CNZZ站长统计来作为第三方的公正评判依据。目前为了方便网站的访客行为追踪管理,许多网站都采用CNZZ的站长统计功能,对访问用户进行信息行为的追踪。 24智能化服务
图书馆的智能化服务,主要体现在信息源与读者之间互动的准确性与及时性。信息源的信息准确与快捷的推送决定了智能化程度的高低。智能化服务可以分为硬件与软件两个方面,硬件的智能化主要体现在智能设备的提供,取代人工读者服务模式,如自助借阅、无线接入、自助预约等。软件的智能化服务主要是信息服务的升级,在掌握读者信息需求的前提下,提供的个性化信息推送等服务。人工智能的研究不断深入,掌握用户(图书馆为读者)的习惯,采用Agent与人工智能相结合并辅助数据挖掘,形成独特的个性化服务系统。如美国北卡罗莱纳州立大学的My Library系统等[13]。国内高校的个性化服务也随着互联网发展而百花齐放,如微信图书馆、移动图书馆等增加读者与图书馆互动性的网络平台[14],图书馆的座位管理系统增加了读者选择图书馆空间的途径。与国外高校相比,国内图书馆的人工智能与数据挖掘研究还处于初始阶段,尚未建立起以读者为研究对象,以资源与空间利用为参考值的读者信息与空间需求动态模型。所谓个性化服务的目的就是在掌握读者需求的前提下,提供读者更加优质与人性化的服务,做到想读者所想,供读者所需的工作,从而在一定程度上提高了图书馆的效益值,也能够做到在有限的投入的基础上,实现资源利用的最大化的目标。本文中提到的智能化服务主要是读者信息追踪与个性化信息推送服务的含义。
25信息追踪
信息追踪技术源起于黑客和网络安全领域,主要用来对IP进行追踪或者逆向追踪,达到获取网络信息或者逆向找出攻击网络地址的目的。随着电子商务的不断发展,网络用户的信息追踪被广泛用于个性化服务中,如淘宝、京东等利用该技术获取用户访问信息,挖掘用户的购买价值。在高校图书馆领域里,利用信息追踪的思想,获取读者的信息需求动态,掌握读者的信息资源价值,用于推广图书馆的服务与资源,提升图书馆的智能化水平。
3信息追踪分类与信息采集意义
31信息追踪分类
信息追踪根据目的与需求的不同,分为多种类型与多种方式。
(1)针对读者兴趣爱好方面信息追踪技术,利用读者访问图书馆的OPAC检索系统,查阅相关资源信息等,获取其对于纸质资源的关注数据信息。部分图书馆学者利用改进的Apriori算法,关联各种数据进行图书馆资源利用率研究,在一定程度上也为个性化服务做数据准备。如学者苏坤利用信息追踪技术可以根据读者兴趣度提供资源推送,同时也能够获取读者兴趣的动态数据[15]。
(2)利用网络安全技术追踪读者信息需求,利用网络监测手段,解析网络数据包,获取读者访问的数字资源信息以及其行为,如浏览、下载等,从而评价数字资源的效益性[7]。
(3)利用图书馆系统日志进行读者应用追踪,掌握读者利用图书馆各种系统的动态数据,获取其需求。
网络安全领域的信息追踪技术,引入图书馆读者信息动态数据研究实践,可以逐步改变了传统的图书馆以资源为中心的办馆模式,在一定程度上能够避免资源的浪费。在围绕读者需求进行图书馆建设的过程中,追踪读者的信息动态是掌握读者信息需求的基础。在针对图书馆信息资源利用的读者信息行为监测过程中,由于图书馆的系统与平台众多,信息追踪的方法存在着差异。将信息追踪方法从理论,纳入到实践应用中,能够提高信息服务效率,降低资源的浪费。
32信息追踪的意义
高校读者根据自身的研究方向、学科背景以及兴趣爱好不同,其信息行为各有差异。如何判断读者的信息需求,是图书馆信息服务中一个关键的步骤。读者需求关系可以分为外延需求和内涵需求两个方面。而读者的兴趣爱好也需要作为信息行为的参数纳入到分析的框架中。读者信息需求与兴趣爱好关系图,如图1所示:
321读者外延需求
读者外延需求是指读者在一定时间内,确定资源获取的目标。如在资源检索过程中,已经确定资源内容和关键词,可以明确表达出书籍、期刊或者文章的名称。外延需求较为精确,需求的目的直接明了。
322读者内涵需求
读者内涵需求是指在读者外延需求以为,无法真实了解读者需求。但是可以通过读者的信息行为能够体现出来。
323读者兴趣爱好
读者的兴趣爱好一般与学科背景无关,主要取决于读者对研究内容的兴趣爱好。高校图书馆一般通过读者的基本信息是无法获取到这类读者的兴趣爱好与知识研究动态信息。只能够通过对该读者的图书馆信息行为进行归类,挖掘分析,得出其研究内容,从而获取其真实的信息需求。
33信息采集意义
随着网络技术的不断发展,高校图书馆的智能化水平不断提高。高校读者在网络中获取资源的途径不断增多。这就动摇了图书馆长期以来作为高校的文献资源保障部门地位。图书馆需要变革,改变原有的服务模式。现在主流图书馆的服务理念是以读者为中心开展资源建设和服务工作。以提升读者的资源利用率与空间利用率为目的推进图书馆的工作。在当前读者信息需求多样化与图书馆资源建设经费不足矛盾的环境下,采取围绕读者所需进行资源建设以及进行读者服务工作,是提高图书馆利用率的手段之一。所以,高校图书馆利用各种信息系统收集读者的图书馆行为数据,以便进行数据挖掘,得出各种信息需求,是建立智能型,节约型图书馆的捷径。
高校图书馆进行读者信息收集的手段很多,如利用图书馆管理系统获取读者纸质资源借阅等信息,得出纸质资源的借阅数据。利用门禁系统与座位管理系统,能够获取到读者到馆空间信息,得出读者比较喜欢的阅览室。利用数字资源统计分析系统,能够获取到读者利用图书馆所提供的数字资源的情况,能够得到读者信息需求动态。图书馆各种系统中日志信息能够记录读者一切与图书馆相关的数据,而图书馆可以利用这些数据进行挖掘,得到图书馆管理工作中所需要的信息。高校图书馆随着互联网技术的不断发展,网络平台服务成为主要的方式[16]。网络平台的多元化,已经改变了原有的门户网站服务模式。移动互联网的便捷性使得移动图书馆,微信图书馆等平台被众多读者所接受。传统的Cookie的网站追踪技术已经无法进行现有平台读者追踪任务。帆布指纹识别方法能够及时追踪读者以及访客关注图书馆网络平台栏目等相关信息,通过对信息数据的数据挖掘与分析,用于信息推广。 4帆布指纹识别信息追踪理论
41实现原理
信息追踪方法中,Cookie是最受欢迎的一种。移动互联网的发展,移动设备限制以及用户禁用Cookie。Cookie的方式追踪方法越来越不够全面。伴随着html5的成熟,通过Canvas Fingerprinting技术标识一个惟一的浏览器逐渐被接受。它的特点是不通过Cookie,用户基本无法屏蔽它。其实现原理[4]:
var canvas=document.createElement(′canvas′);
var ctx=canvas.getContext(′2d′);
var txt=′http:∥security.tencent.com/′;
ctx.textBaseline=″top″;
ctx.font=″14px′Arial′″;
ctx.textBaseline=″tencent″;
ctx.fillStyle=″#f60″;
ctx.fillRect(125,1,62,20);
ctx.fillStyle=″#069″;
ctx.fillText(txt,2,15);
ctx.fillStyle=″rgba(102,204,0,07)″;
ctx.fillText(txt,4,17);
42测试结果
由于涉及设备以及浏览器的判定因素非常多,重复性很低,31台设备皆无重复,但是可以设想,毕竟是通过各种属性值去判断惟一性,理想情况下如果两台设备相同浏览器各种设置也相同,还是会出现重复。也正因为涉及的因素多,一旦设备系统更新、浏览器版本更新或者浏览器关键插件有变化(版本更新或者新增卸载关键插件),生成的ID都会改变,由于浏览器版本更新还是比较频繁的,很容易失去之前跟踪的用户[17]。
所以Canvas指纹只能作为一参考属性去判断设备的惟一性,不能只用这一个因素来判定设备惟一性。FingerPrint.js也不能取代Cookie,但是可以作为辅助,如果用户清除了Cookie的情况下,还可以通过FingerPrint.js跟踪到该用户重新Set Cookie。总之帆布指纹识别系统能够追踪读者用户,能够适应当前主流的终端。帆布指纹识别适用于多平台的网站门户追踪方式,在现在还未完全普及,对于信息追踪技术领域,该技术已经代表了新一代的信息追踪的前沿的模式。
帆布指纹识别信息追踪主要运用于网络平台,而随着图书馆各种系统安全性能不断增强,网络化趋势也逐步明显,引用支持多平台的信息追踪模式也是未来图书馆进行信息化服务基础模式之一。
5CNZZ信息追踪意义与实践
信息追踪的主要目的是获取具体读者在一段时间内的各种系统中关键词等信息动态,用以分析得到读者需求信息。信息追踪数据加以实践研究,高校图书馆智能化实践应用,以提升图书馆智能化服务。根据高校图书馆实际需要,可以将智能服务分为以下3个方面:智能图书推荐服务、数字资源推荐服务、空间服务推荐服务。
51智能图书推荐服务
在高校图书馆中,OPAC(Online Public Access Catalogue)系统在图书推荐中发挥着很重要的作用。由于图书馆的纸资资源被读者检索,借阅都需要OPAC系统的支持,而OPAC会记录读者的信息行为,如检索词等相关内容,后台系统会根据内容进行数据汇集、挖掘、排名,将热点词以及热门借阅图书馆等推荐到OPAC主页上,如热门检索、热门图书、热门借阅等栏目中。
52数字资源推荐服务
不同的数字资源系统都有数据的统计功能,将热门的检索、下载、关注内容按照热点排名进行推荐服务。如维普的主页中,时刻显示推荐有关文章、期刊、主题、作者、机构、基金、学科、地区等不同类别的动态数据信息。在网络平台中的信息推送服务,已经被广大商务网站应用,通过读者的访问习惯采集其信息数据,推送相关内容已经逐渐成为数字资源信息服务主要的方式之一。
53空间服务推荐服务
图书空间服务的推荐,主要需要图书馆各种空间服务系统的支持,如座位管理系统,门禁系统等能够记录读者空间动态信息的设备,通过记录一段时间内或者当前读者在图书馆内的偏好信息,推荐相关空间数据供其选择。如座位管理系统推荐读者选择热门位置等。
54CNZZ信息追踪实践性分析
CNZZ运用信息追踪方式,能够有效的获取访问网站用户的各种特征与部分偏好信息。如以南京晓庄学院图书馆网站http:∥lib.njxzc.edu.cn/main.htm为例,通过CNZZ站长统计平台,获取用户访问的信息如图2所示:图2CNZZ信息追踪图
图2显示,在一天中有关用户访问网站的信息,能够区分新老用户以及通过的路径访问等信息。包括有关搜索词等信息。图书馆管理者时刻关注其中的动态数据信息,才能够及时掌握读者对图书馆门户部门的偏好和意见。如搜索词中,“有读者检索南京晓庄学院图书馆为什么进不了知网”的信息,从某种方面反映了读者在使用图书馆过程中,需要帮助或者图书馆网络平台出现了故障。
6高校图书馆信息追踪模型建立
61读者信息追踪
读者作为图书馆的服务对象,动态掌握读者的信息需求方法,是图书馆实行读者信息追踪的目的。图书馆信息追踪的方法很多,例如针对数字资源利用的信息追踪可以采用网络监测,针对读者图书馆网站访问行为的信息追踪可以使用帆布指纹识别技术和CNZZ工具等,针对读者纸质资源需求的信息追踪可以使用图书馆管理系统,如汇文系统的统计模块。针对读者在图书馆的空间行为的信息追踪可以使用无线设备接入监测系统等。
〔关键词〕帆布指纹识别;读者行为追踪;高校图书馆;智能化服务;CNZZ
DOI:10.3969/j.issn.1008-0821.2016.07.019
〔中图分类号〕G2507〔文献标识码〕A〔文章编号〕1008-0821(2016)07-0107-06
1研究背景
在图书馆服务工作中提出的智能化信息服务也可以称为个性化信息服务,主要是指在互联网环境下,动态掌握读者信息需求的数据,以此为基础进行数据挖掘,推送图书馆拥有的相关资源信息至读者的过程。例如汇文管理系统的馆藏数目查询系统中,可以提供热门图书等信息,就是根据读者的借阅量与检索行为等数据分析出来的结果。高校图书馆追踪读者的信息行为的条件比较成熟,首先,高校图书馆网络环境处于校园网中,资源尤其是数字资源的访问受到一定的限制,如IP地址等。其次,高校用户通过网络访问需要进行认证,最后,高校读者在图书馆以及校园网络中,有较为详细的信息,如部门、学历、邮箱等。所以在高校范围之内进行针对读者的信息追踪,具有一定的理论与实践基础。读者由于自身的原因,如学科背景、研究偏好等,对于资源的内容和要求也不尽相同。图书馆需要建立一套针对读者信息的需求系统,用以追踪读者日益增长的信息需求动态信息行为。智能化信息服务实现的基础就是追踪获取读者信息需求数据,在掌握读者需求数据的基础上才能够实现读者服务的针对性、主动性、连续性、专业性与易用性的特点,也能够间接地提高读者对高校图书馆信息服务的满意度[1]。互联网的普及拓展了资源获取的途径,互联网内容不断丰富也增加了信息的总量,也促使图书馆的服务模式由信息服务向知识管理服务转变。在电子商务网站为主体的网络服务商急需一种新的信息服务的模式,用以满足用户的不断增长同时也不断变化的需求。智能化服务是网络信息社会的基本特征之一[2],只有不断改变信息服务模式,满足并适应不同用户群体的不同需求,才能够在竞争激烈的信息环境下表现出顽强的生命力。广告联盟和电子商务网站都希望准确定位,通过对用户行为进行分析,如浏览页面、下载内容、检索主题等,为用户推送更加精准的广告,同时可以通过对用户的标识,可以将不同站点的用户进行关联[3-4]。高校图书馆在信息服务工作中,也需要尝试着一些方法获取读者的资源访问信息,例如设计并实现了数字资源统计分析系统,实时掌握读者利用馆内数字资源情况[5-8]。利用CNZZ[9]的站长统计的功能对读者访问图书馆网站情况进行统计分析[10]。随着信息技术的不断发展,高校图书馆的智能化服务也逐步借鉴商业网络成熟的技术经验与案例,用以实施与部署自身资源服务。例如利用微信公共号平台建设微信图书馆[11]。部分图书馆和学者运用网络监控方法搜集读者的资源访问数据,用以评估指导数字资源建设。在信息技术引领着高校图书馆资源建设与学科服务发展的环境下,由于高校读者群体相对稳定,可以通过信息追踪的方式获取读者需求的动态信息,同时对收集的信息进行分类,并挖掘读者需求数据,将结果利用在智能化服务中,用以提升了服务的效率,降低了资源建设成本,达到智能化和精细化服务的目的。
2理论基础与技术关键
21精细化服务
在经济管理领域,经常提倡在管理以及经济建设过程中,需要由粗放型向精细化建设转变。而图书馆历年来思路也在不断转变,也由过去的粗放型的资源建设和读者服务向精细化的目的性服务转变。例如在资源建设过程中,引入读者参与推荐购买资源模式等。读者服务过程中,设置意见渠道,时刻掌握读者反馈的意见和建议,逐一调整服务工作中存在的问题与不足。而粗放型逐步转变成精细化的主要中心思想是以读者为中心,建立一套服务读者的信息资源保障体系,是未来图书馆智能化与人性化建设的中心内容。
22帆布指纹识别
互联网用户逐渐对个人隐私的重视,通过Cookie收集用户的信息方法其可靠性逐渐降低。不少安全工具甚至是浏览器都开始允许或引导用户关闭Cookie功能,例如很多主流浏览器都有一个“隐私模式浏览”功能。因此网站无法对访客进行追踪。但是有一些特例如通过Flash Cookie的方式也可以达到惟一标识和追踪的目的。2013年开始国外媒体报道了一种非常难以摆脱的新型在线追踪工具被用来追踪白宫等热门网站的访问者。这就是一种比较新的访客追踪技术:“帆布指纹识别”技术。这个技术的优势在于不像通过Cookie或者Flash Cookie等之类的方式,网络访客无法屏蔽。图书馆的网络平台模式主要是以图书馆的门户为基础,移动服务端等多平台并存的组合形成图书馆信息服务保障系统。掌握访问用户的信息行为也是未来图书馆所需要追踪的信息行为内容之一。
23CNZZ站长统计
目前国内站长使用最多的网站流量系统,为网站提供安全、可靠、公正的第三方网站访问免费统计,是一个针对目的网站的流量统计分析工具。通过CNZZ站长统计[12],网站管理员可以随时知道管理的网站的被访问情况,例如访问人次、访问网页、新访客的来源地点、网站的用户的地区分布等非常有价值的信息数据。管理员可以根据CNZZ站长统计,可以动态掌握网站的访问情况,及时调整自己的页面内容,推广方式,以及对目的网站的调整做出客观公正的评测。同时CNZZ站长统计已经被业内公认为是一个可信赖的第三方评判标准,发生网站访问流量方面的疑问时,业界相关人员都愿意以CNZZ站长统计来作为第三方的公正评判依据。目前为了方便网站的访客行为追踪管理,许多网站都采用CNZZ的站长统计功能,对访问用户进行信息行为的追踪。 24智能化服务
图书馆的智能化服务,主要体现在信息源与读者之间互动的准确性与及时性。信息源的信息准确与快捷的推送决定了智能化程度的高低。智能化服务可以分为硬件与软件两个方面,硬件的智能化主要体现在智能设备的提供,取代人工读者服务模式,如自助借阅、无线接入、自助预约等。软件的智能化服务主要是信息服务的升级,在掌握读者信息需求的前提下,提供的个性化信息推送等服务。人工智能的研究不断深入,掌握用户(图书馆为读者)的习惯,采用Agent与人工智能相结合并辅助数据挖掘,形成独特的个性化服务系统。如美国北卡罗莱纳州立大学的My Library系统等[13]。国内高校的个性化服务也随着互联网发展而百花齐放,如微信图书馆、移动图书馆等增加读者与图书馆互动性的网络平台[14],图书馆的座位管理系统增加了读者选择图书馆空间的途径。与国外高校相比,国内图书馆的人工智能与数据挖掘研究还处于初始阶段,尚未建立起以读者为研究对象,以资源与空间利用为参考值的读者信息与空间需求动态模型。所谓个性化服务的目的就是在掌握读者需求的前提下,提供读者更加优质与人性化的服务,做到想读者所想,供读者所需的工作,从而在一定程度上提高了图书馆的效益值,也能够做到在有限的投入的基础上,实现资源利用的最大化的目标。本文中提到的智能化服务主要是读者信息追踪与个性化信息推送服务的含义。
25信息追踪
信息追踪技术源起于黑客和网络安全领域,主要用来对IP进行追踪或者逆向追踪,达到获取网络信息或者逆向找出攻击网络地址的目的。随着电子商务的不断发展,网络用户的信息追踪被广泛用于个性化服务中,如淘宝、京东等利用该技术获取用户访问信息,挖掘用户的购买价值。在高校图书馆领域里,利用信息追踪的思想,获取读者的信息需求动态,掌握读者的信息资源价值,用于推广图书馆的服务与资源,提升图书馆的智能化水平。
3信息追踪分类与信息采集意义
31信息追踪分类
信息追踪根据目的与需求的不同,分为多种类型与多种方式。
(1)针对读者兴趣爱好方面信息追踪技术,利用读者访问图书馆的OPAC检索系统,查阅相关资源信息等,获取其对于纸质资源的关注数据信息。部分图书馆学者利用改进的Apriori算法,关联各种数据进行图书馆资源利用率研究,在一定程度上也为个性化服务做数据准备。如学者苏坤利用信息追踪技术可以根据读者兴趣度提供资源推送,同时也能够获取读者兴趣的动态数据[15]。
(2)利用网络安全技术追踪读者信息需求,利用网络监测手段,解析网络数据包,获取读者访问的数字资源信息以及其行为,如浏览、下载等,从而评价数字资源的效益性[7]。
(3)利用图书馆系统日志进行读者应用追踪,掌握读者利用图书馆各种系统的动态数据,获取其需求。
网络安全领域的信息追踪技术,引入图书馆读者信息动态数据研究实践,可以逐步改变了传统的图书馆以资源为中心的办馆模式,在一定程度上能够避免资源的浪费。在围绕读者需求进行图书馆建设的过程中,追踪读者的信息动态是掌握读者信息需求的基础。在针对图书馆信息资源利用的读者信息行为监测过程中,由于图书馆的系统与平台众多,信息追踪的方法存在着差异。将信息追踪方法从理论,纳入到实践应用中,能够提高信息服务效率,降低资源的浪费。
32信息追踪的意义
高校读者根据自身的研究方向、学科背景以及兴趣爱好不同,其信息行为各有差异。如何判断读者的信息需求,是图书馆信息服务中一个关键的步骤。读者需求关系可以分为外延需求和内涵需求两个方面。而读者的兴趣爱好也需要作为信息行为的参数纳入到分析的框架中。读者信息需求与兴趣爱好关系图,如图1所示:
321读者外延需求
读者外延需求是指读者在一定时间内,确定资源获取的目标。如在资源检索过程中,已经确定资源内容和关键词,可以明确表达出书籍、期刊或者文章的名称。外延需求较为精确,需求的目的直接明了。
322读者内涵需求
读者内涵需求是指在读者外延需求以为,无法真实了解读者需求。但是可以通过读者的信息行为能够体现出来。
323读者兴趣爱好
读者的兴趣爱好一般与学科背景无关,主要取决于读者对研究内容的兴趣爱好。高校图书馆一般通过读者的基本信息是无法获取到这类读者的兴趣爱好与知识研究动态信息。只能够通过对该读者的图书馆信息行为进行归类,挖掘分析,得出其研究内容,从而获取其真实的信息需求。
33信息采集意义
随着网络技术的不断发展,高校图书馆的智能化水平不断提高。高校读者在网络中获取资源的途径不断增多。这就动摇了图书馆长期以来作为高校的文献资源保障部门地位。图书馆需要变革,改变原有的服务模式。现在主流图书馆的服务理念是以读者为中心开展资源建设和服务工作。以提升读者的资源利用率与空间利用率为目的推进图书馆的工作。在当前读者信息需求多样化与图书馆资源建设经费不足矛盾的环境下,采取围绕读者所需进行资源建设以及进行读者服务工作,是提高图书馆利用率的手段之一。所以,高校图书馆利用各种信息系统收集读者的图书馆行为数据,以便进行数据挖掘,得出各种信息需求,是建立智能型,节约型图书馆的捷径。
高校图书馆进行读者信息收集的手段很多,如利用图书馆管理系统获取读者纸质资源借阅等信息,得出纸质资源的借阅数据。利用门禁系统与座位管理系统,能够获取到读者到馆空间信息,得出读者比较喜欢的阅览室。利用数字资源统计分析系统,能够获取到读者利用图书馆所提供的数字资源的情况,能够得到读者信息需求动态。图书馆各种系统中日志信息能够记录读者一切与图书馆相关的数据,而图书馆可以利用这些数据进行挖掘,得到图书馆管理工作中所需要的信息。高校图书馆随着互联网技术的不断发展,网络平台服务成为主要的方式[16]。网络平台的多元化,已经改变了原有的门户网站服务模式。移动互联网的便捷性使得移动图书馆,微信图书馆等平台被众多读者所接受。传统的Cookie的网站追踪技术已经无法进行现有平台读者追踪任务。帆布指纹识别方法能够及时追踪读者以及访客关注图书馆网络平台栏目等相关信息,通过对信息数据的数据挖掘与分析,用于信息推广。 4帆布指纹识别信息追踪理论
41实现原理
信息追踪方法中,Cookie是最受欢迎的一种。移动互联网的发展,移动设备限制以及用户禁用Cookie。Cookie的方式追踪方法越来越不够全面。伴随着html5的成熟,通过Canvas Fingerprinting技术标识一个惟一的浏览器逐渐被接受。它的特点是不通过Cookie,用户基本无法屏蔽它。其实现原理[4]:
var canvas=document.createElement(′canvas′);
var ctx=canvas.getContext(′2d′);
var txt=′http:∥security.tencent.com/′;
ctx.textBaseline=″top″;
ctx.font=″14px′Arial′″;
ctx.textBaseline=″tencent″;
ctx.fillStyle=″#f60″;
ctx.fillRect(125,1,62,20);
ctx.fillStyle=″#069″;
ctx.fillText(txt,2,15);
ctx.fillStyle=″rgba(102,204,0,07)″;
ctx.fillText(txt,4,17);
42测试结果
由于涉及设备以及浏览器的判定因素非常多,重复性很低,31台设备皆无重复,但是可以设想,毕竟是通过各种属性值去判断惟一性,理想情况下如果两台设备相同浏览器各种设置也相同,还是会出现重复。也正因为涉及的因素多,一旦设备系统更新、浏览器版本更新或者浏览器关键插件有变化(版本更新或者新增卸载关键插件),生成的ID都会改变,由于浏览器版本更新还是比较频繁的,很容易失去之前跟踪的用户[17]。
所以Canvas指纹只能作为一参考属性去判断设备的惟一性,不能只用这一个因素来判定设备惟一性。FingerPrint.js也不能取代Cookie,但是可以作为辅助,如果用户清除了Cookie的情况下,还可以通过FingerPrint.js跟踪到该用户重新Set Cookie。总之帆布指纹识别系统能够追踪读者用户,能够适应当前主流的终端。帆布指纹识别适用于多平台的网站门户追踪方式,在现在还未完全普及,对于信息追踪技术领域,该技术已经代表了新一代的信息追踪的前沿的模式。
帆布指纹识别信息追踪主要运用于网络平台,而随着图书馆各种系统安全性能不断增强,网络化趋势也逐步明显,引用支持多平台的信息追踪模式也是未来图书馆进行信息化服务基础模式之一。
5CNZZ信息追踪意义与实践
信息追踪的主要目的是获取具体读者在一段时间内的各种系统中关键词等信息动态,用以分析得到读者需求信息。信息追踪数据加以实践研究,高校图书馆智能化实践应用,以提升图书馆智能化服务。根据高校图书馆实际需要,可以将智能服务分为以下3个方面:智能图书推荐服务、数字资源推荐服务、空间服务推荐服务。
51智能图书推荐服务
在高校图书馆中,OPAC(Online Public Access Catalogue)系统在图书推荐中发挥着很重要的作用。由于图书馆的纸资资源被读者检索,借阅都需要OPAC系统的支持,而OPAC会记录读者的信息行为,如检索词等相关内容,后台系统会根据内容进行数据汇集、挖掘、排名,将热点词以及热门借阅图书馆等推荐到OPAC主页上,如热门检索、热门图书、热门借阅等栏目中。
52数字资源推荐服务
不同的数字资源系统都有数据的统计功能,将热门的检索、下载、关注内容按照热点排名进行推荐服务。如维普的主页中,时刻显示推荐有关文章、期刊、主题、作者、机构、基金、学科、地区等不同类别的动态数据信息。在网络平台中的信息推送服务,已经被广大商务网站应用,通过读者的访问习惯采集其信息数据,推送相关内容已经逐渐成为数字资源信息服务主要的方式之一。
53空间服务推荐服务
图书空间服务的推荐,主要需要图书馆各种空间服务系统的支持,如座位管理系统,门禁系统等能够记录读者空间动态信息的设备,通过记录一段时间内或者当前读者在图书馆内的偏好信息,推荐相关空间数据供其选择。如座位管理系统推荐读者选择热门位置等。
54CNZZ信息追踪实践性分析
CNZZ运用信息追踪方式,能够有效的获取访问网站用户的各种特征与部分偏好信息。如以南京晓庄学院图书馆网站http:∥lib.njxzc.edu.cn/main.htm为例,通过CNZZ站长统计平台,获取用户访问的信息如图2所示:图2CNZZ信息追踪图
图2显示,在一天中有关用户访问网站的信息,能够区分新老用户以及通过的路径访问等信息。包括有关搜索词等信息。图书馆管理者时刻关注其中的动态数据信息,才能够及时掌握读者对图书馆门户部门的偏好和意见。如搜索词中,“有读者检索南京晓庄学院图书馆为什么进不了知网”的信息,从某种方面反映了读者在使用图书馆过程中,需要帮助或者图书馆网络平台出现了故障。
6高校图书馆信息追踪模型建立
61读者信息追踪
读者作为图书馆的服务对象,动态掌握读者的信息需求方法,是图书馆实行读者信息追踪的目的。图书馆信息追踪的方法很多,例如针对数字资源利用的信息追踪可以采用网络监测,针对读者图书馆网站访问行为的信息追踪可以使用帆布指纹识别技术和CNZZ工具等,针对读者纸质资源需求的信息追踪可以使用图书馆管理系统,如汇文系统的统计模块。针对读者在图书馆的空间行为的信息追踪可以使用无线设备接入监测系统等。