数据挖掘技术在图书馆中的应用及带来的影响

来源 :商品与质量·建筑与发展 | 被引量 : 0次 | 上传用户:yingzizhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】 随着社会经济的发展,计算机网络技术、通信技术取得了突飞猛进的进展,获得有关资料非常简单易行,但对于数据量大的数据,要从中获得分析结果,用于指导工作,传统的统计方法无法实现。“数据挖掘”(DM)应运而生,它是一种新的数据处理技术,是DKK中的重要技术。本文在描述数据挖掘的概念以及数据挖掘方法的基础上,阐述了数据挖掘技术在图书馆中的应用,并且论述其对图书馆的影响。
  【关键词】 数据挖掘;图书馆;应用;影响
  引言:随着计算机技术和信息技术的快速发展,数据库技术的应用越来越广泛,逐渐深入到图书馆领域,图书馆的馆藏内容以及服务对象、范围、深度都发生了深刻变革。用户信息需求日趋多元化和个性化,他们已经不满足于图书馆传统的服务,而期望图书馆根据其各个不同的需求,提供个性化、网络化、集成化的信息服务。图书馆要适应这一变化,引入信息技术,改进服务方式、手段,帮助读者在少量的信息中找到有用的知识,真正提高图书馆的工作效率,实现全社会的信息资源共享,数据挖掘技术正是图书馆实现智能转变的应用技术之一。
  1、数据挖掘概述
  数据挖掘是几年来兴起的一门新的交叉学科技术,是近十年计算机科学研究的热点之一,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘有用的信息和知识,提供决策支持。在数据挖掘领域,汇集了数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,形成了新的技术热点。数据挖掘有广义和狭义之分:广义的数据挖掘是指从大量的数据中发现隐藏的、内在的和有用的知识和信息的过程;狭义的数据挖掘是指知识发现中的一个关键步骤,是一个抽取有用模式或建立模型的重要环节。数据挖掘是在对数据集全面而深刻认识的基础上,对数据内在和本质的高度抽象与概括,也是对数据从理性认识到感性认识的升华。数据挖掘过程可分为三个阶段:数据准备、采掘操作、结果表达和解释。一般认为,数据挖掘是知识发现过程中的一个特定步骤,它用专门算法从数据库中抽取模式,然后通过系统解释和评价模块将模式转换成用户可以理解的知识。数据挖掘的研究融合了多个不同学科领域技术与成果,使得目前的数据挖掘方法表现出多种多样的形式。从统计分析类的角度来说,统计分析技術中使用的数据模型有线形分析和非线形分析、回归分析、逻辑分、单变量分析、多变量分析、时间序列分析、最近序列分析、最近邻算法和聚类分析等方法。利用这些技术可以检查那些异常形式的数据,然后,利用各种统计模型和数学模型解释这些数据,解释隐藏在这些数据此后的商业规律和商业机会。知识发现类数据挖掘技术是一种与统计分析类数据挖掘技术完全不同的挖掘技术,包括人工神经元网络、支持向量机、决策树、遗传算法、粗糙集、规则发现和关联顺序等。
  2、数据挖掘在图书馆中应用的必要性
  2.1信息化发展的需求
  在当前这个信息技术飞速发展的社会中,只有必须引进和运用先进的技术,图书馆才能更好的生存与发展。从近代图书馆的理论与实践来看,图书馆一直在不遗余力地追逐着信息/计算机技术的发展。信息技术极大地推动了图书馆的现代化进程,同时也带来了信息的爆炸式增长。在知识经济时代,解决好海量信息的存储开发与利用,是关系到图书馆未来的生存与发展的重大问题。运用数据挖掘技术实现从海量数据中挖掘出知识以支持图书馆各种层次的科学决策服务,实现高效的行业信息合作模式,是信息化带来的外部压力与图书馆内部发展机制的共同需求。
  2.2支持图书馆管理、建设决策
  管理水平的高低直接影响图书馆的运行,目前。管理水平低下是影响我国图书馆事业发展的重要因素之一,管理水平的提高很大程度上取决于决策的科学与否。传统的图书馆决策方式大多依靠经验进行决策,存在主观、片面、盲目等诸多问题,无法适应时代发展的要求,采用数据挖掘技术能够为领导层的科学决策提供强有力的保障。利用数据挖掘技术可以对集成数据进行多维分析比较,对决策假设进行审查和验证,提高决策的可靠度和可行性,达到合理利用有限资金,优化图书馆的资源配置的目的。数据挖掘工具可以从历史数据中找出潜在的模式,并在模式的基础上自动做出预测,这对启发图书馆决策者的创新思维、应对信息化社会的挑战具有重大意义。
  2.3满足个性化服务需求
  计算机网络的发展使的现代图书馆的服务更加多样化,使图书馆咨询需求不再局限于简单层次的信息查询与反馈,而是转向广阔的信息源,要求咨询人员提供综合度高、附加值大的信息产品。以数据仓库为基础的信息架构,既含有了图书馆的历史信息,也含有当前信息,同时还集成有外部数据,为查询提供了一个广阔的数据源。同时,结合数据挖掘工具,一方面可以帮助管理者从海量数据中分析出事物之间的关联,挖掘出隐藏其中的规律信息,形成满足用户需求的深层次信息产品。另一方面,还可以根据用户的历史咨询记录,分析出他们的研究方向和兴趣所在,实现主动的个性化信息服务。
  3、数据挖掘在图书馆工作中的应用
  3.1指导信息资源采集
  在图书馆的文献采集工作中,每年的购置资费是有限的,因此必须对文献的购置进行合理的分配,各门学科之间如何分配、各种文献载体形式如何均衡才能使这些经费最好地发挥效益,这是一件令人头疼的事。通过对图书馆借阅、流通状况及馆藏书目库的分析、挖掘,这一问题便可迎刃而解。其次,利用数据挖掘技术对Internet上无序的、非结构的数据进行采集、分类,使图书馆的信息资源更加丰富。
  3.2在文献建设工作中的应用
  采访是图书馆各项业务工作的第一个环节,是图书馆藏书建设和文献资源布局的首要内容。传统图书馆信息采集多由专门采访人员独自确定,或采纳学科专家的意见,不可避免地带有极大的主观性以及个人喜好。同时,图书馆每年的文献购置费是有限的,各门学科之间如何分配,各种文献载体形式如何均衡才能使这些经费最好的发挥效益,这一直是困扰着采访人员的难题。另外,图书馆内每天产生大量可以对采访工作产生指导作用的数据,如自动化系统中的流通数据,图书馆的历史采购数据,各种查询数据等等,如何从这些大量数据中分析、统计出有用信息并非易事。传统做法只能做些模糊分析与评价,而数据挖掘技术的应用将使这些问题迎刃而解。   3.3在流通管理中的应用
  图书馆的日常运行中,常常会遇到图书的破损、丢失等问题,如何防止这类问题的发生也是值得通过数据挖掘进行研究的一个方面。通过对历年借阅数据的相关分析,相应的增长幅度较大的图书种类在上架的时候应根据预测的趋势预留架位;通过对注销数据的分类分析统计及与样本库比较以确认若丢失率超过一定比例的原因出在哪些方面,给出一个在制度上或人员上加强管理的建议对于那些借阅频率较高且连续续借的书目,应以量化的方式反馈给采访部门以加大采购的力度;对罚、赔款数据的挖掘则可提供对诸如特定书目的借阅期限和人员限制等的建设性建议以提高服务质量。
  3.4在信息服務中的应用
  信息技术的发展,使得传统的“等读者上门”服务理念逐渐淘汰,这种管理模式己经不适应读者新的服务要求,而且,在对读者提供信息服务过程中,读者提出的检索任务和信息需求在综合性、复杂性、有序性等方面也有越来越高的要求,读者不再满足于对相关信息、信息线索、文献书目数据或信息参考数据的获取,而更注重获取有深度的信息内容、文献全文或针对查询问题的全面深层解答。通过收集整理图书馆自动化管理系统积累的有序数据和图书馆网站上的在线调查、留言簿等数据,或是设计读者调查表,包括读者的基本情况、阅读兴趣、查阅资料的途径及对国内外文献资源的需求情况等,将这些元数据转化为标准的结构化数据库,利用数据挖掘方法分析读者索取信息的倾向,发现用户兴趣模式,以用户信息需求为出发点,对用户行为进行分类、聚类分析,了解用户的普遍需求和特殊需求,提供个性化服务。所谓个性化服务就是针对用户的特定需求主动地向用户提供经过集成的相对完整的信息集合或知识集合。个性化服务的形式有三种:(1)按照特定用户请求,为用户提供定制的Web页面,信息频道或信息栏目,实施查询代理服务;(2)按照特定主题,给出文献源或提供文献全文,实施个性化文献性信息服务;(3)按照特定主题,提供相对完整的方案知识,实施个性化决策支持服务。
  4、数据挖掘对图书馆的影响
  4.1改变读者需求和提升图书馆的服务理念
  图书馆有大量的电子和纸本的文献完全可以满足读者“资料”需求,而读者更喜欢进入搜索引擎,或一些共享平台等数据挖掘手段获取学习资料或文献,这些文献的质量可靠性、可利用性和合法性都是值得考量的;读者为什么仍然不选择图书馆,问题的关键在于如果图书馆把一种新的传播方式和新的传播介质的出现,仅仅理解为是多了一个传播通路或传播平台的话,就会极大地低估了这种传播技术革命之于经济和社会生活改变的影响。在社会化平台上,读者获取的不仅仅是信息或文献的本身,而是可以获取读者之间交流“情感”,或者某种“信任”;当然读者也需要和图书馆之间建立这种“交流”。总之,数据挖掘拓展了读者的生活体验,使读者的社会判断和社会决策更加感性化,其感性判断得到了极大调动和激活,越来越多地参与到行为认知之中。因此,图书馆不是把传统服务的每一步都按图书馆人的想法做得非常到位和透彻,而在于是否让读者体验到这种服务内容、出发点、服务主题所带来的全方位的细腻感受。服务理念是由图书馆最高决策者确定,并为图书馆大多数人所接受的一系列观念思想、行为准则的总和,“以人为本”是现代图书馆的读者服务理念,数据挖掘技术使图书馆可以根据读者需求的变化来开展适应读者的服务;信息化的发展将读者的内心需求进行无限度的裸露,使得图书馆有机会不断满足读者多种需求。“满足读者的需求”是图书馆精神的重要体现,是“以人为本”的动力,是图书馆现代管理的核心,因此,图书馆需要对办馆理念进一步完善与升华。
  4.2改变图书馆与读者的“交流方式”
  从图书馆只有借阅纸本书服务,到可以提供电子书、电子期刊和多媒体等数字化服务,有一点始终不变的是,图书馆仍然是以“物”传播给读者。单向的传播方式,缺少与读者交流和响应读者问题,以及针对读者进行坦诚的、互动式的沟通,而且传播结构只有图书馆与读者,严重缺乏对于多元化意见场域的博弈、协调与整合的经验和模式。缺乏按“需”服务传播方式,使图书馆很可能开展了多项服务和工作,却没有联系读者的实际情况。以facebook、pinternet为代表的共享平台,改变人们的生活方式和交流方式。七横八纵的传播渠道,五花八门的传播方式,以及读者之间重重叠叠的关系嵌套,形成核裂变式的传播效应,是当前网络传播领域中一道亮丽的景观。以微博为例,这些共享平台的出现不仅仅使读者的意见、经验等信息沟通更加便捷和即时,使图书馆可与读者进行“快速”的“双向”交流,并使读者任何一次发言和分享都有一个“点对面”传播的作用,这种传播方式不仅在同班同学或同一个校园的师生间,而且在有网络的地方都可以进行,这种传播具有更大的渗透力和影响力。过去读者来图书馆只是为了查找文献和自修,读者彼此之间独立;现在读者借助于虚拟网络可以跨越现实关系的羁绊,在图书馆以外的物理空间或网络空间里找到“同声相求、同气相求”的同道,他们相互交流、彼此信任,这种交流方式使读者以同一兴趣为纽带集中在一起谈论“同一个主题”。图书馆要想开展读者满意的服务,就必须找到不同“部落”对话的切入点,并且成为“部落”中的一人,以“部落”的成员角色与其他成员进行多元化的交流。
  5、图书馆应如何数据挖掘技术带来的影响
  5.1掌握读者需求,提升读者对图书馆的关注度
  为了应对数据挖掘技术带来的变化,图书馆需要借助信息化网络技术。跨越校园网的信息障碍,获得有价值的读者信息与数据并掌握大量的第一手材料,这不仅有助于高质量的读者信息勘察,同时也将有效提升图书馆对校园之外渠道的利用能力;其次,在图书馆面临多渠道管理难题的时候,数据挖掘技术使图书馆能通过读者的直接反馈,更客观地比较和评估各种渠道的优势与劣势,让图书馆有机会调整不同的渠道策略;第三,由于网络沟通的开放平台属性,各种渠道可以通过平台,增进相互之间的了解,有效地缓解新旧渠道间存在的冲突。最后,在图书馆开展文献资源建设过程中,要不断把握读者需求,及时调整文献资源建设、文献采购的方针政策,补充读者所需的文献,保证图书馆的文献资源建设具有针对性、实用性、时效性、特色性等特点,满足不同层次读者的需要。   5.2积极参与和利用社会化媒体
  图书馆积极利用数据挖掘技术的目的就是增加更多与读者交流的机会,藉由与读者交流、分享,并促使其认同,并使其愿意协助分享给其他的好友,达到宣传的目的;借网络平台掌握读者的需求信息开展有针对性的信息服务,从而达到圖书馆影响力的提升。首先,图书馆应该善用博客、微博,并通过博客发展属于图书馆最忠实的读者。毕竟博客有每日、经常性、深度的特性,本来就是联系忠实读者最直接的渠道。第二,善用社群网站“分享”、“收藏”的按钮功能,让忠实的读者可以快速地把相关的内容、消息自由散播,并带动更多的好友,使其达到真正“群”的目的。第三,善用视频等网站的亲民魅力,让更多Mashup的网站对图书馆网站内容进行整合。比如有读者在网站看到了一段视频而且很想看,这时如果能让读者知道自己学校图书馆收藏了此视频资源,可以想象此时读者会是什么心情。因此好好地做好Mashup网站社交媒体营销,紧紧抓住忠实读者。因此,图书馆要做好推广工作,才能起到更佳效果。
  5.3拓展和创新服务
  图书馆应将创新服务模式与创新支持理念直接推送给用户。牢牢树立以“服务”为本的办馆思想,融合社区服务理念提出了“资料随手可得、信息共享空间、咨询无处不在;馆员走进学科;技术支撑服务;科研推进发展”的服务理念,为读者提供“一流服务、主动服务、智能服务、一站式服务、自助式服务;个性化服务、人性化服务”。成功地拓展和创新图书馆读者服务,其出发点就是“满足读者的需求”。“需求、借用与提高”是互联网的真谛,“创新”则是图书馆开展一切工作的中心环节,是图书馆事业不断发展的基石。图书馆必须利用新技术进行创新服务才可以服务好读者,而且图书馆所开展的一切服务必须以满足读者的需求为出发点不断进行创新活动。
  6、结语
  随着现代计算机技术和信息技术的发展,越来越多的图书馆将现代信息技术引入并加以运用,使图书馆的信息资源更加丰富、优化、有效,服务质量发生质的飞跃,随着硬件环境、挖掘算法的改进、应用的普及经验的积累,数据挖掘技术在图书馆的应用一定会取得长足的发展与进步。信息化时代的到来,迅速冲击着读者的学习和生活,同样改变了图书馆服务,给图书馆创造了新机会,提供新的服务工具,在这场信息化运动中,图书馆要积极利用新技术,大胆创新,才能赢得读者,才能服务好读者。
  参考文献:
  [1]黄解军,燔和平,万幼川.数据挖掘技术的应用研究.计算机工程与应用,2003;(2)
  [2]冶红.基于数据挖掘的Web挖掘系统的研究.大连理工大学硕士学位论文,2003103
  [3]高洪深.决策支持系统(DSS))理论方法案例(第二版).北京:清华大学出版社,2000
其他文献
【摘 要】 积极应用BIM等新兴技术,使用信息化手段,促进我国新型建筑工业化发展是我国建筑业走可持续发展道路的必然选择。本文介绍了BIM技术的概念和特点,探讨了BIM技术在工程中的综合应用.  【关键词】 BIM技术;工程;应用  前言:  现代大型建设项目一般具有投资规模大、建设周期长、参建单位众多、项目功能要求高以及全寿命周期信息量大等特点,建设项目设计以及工程管理工作极具复杂性,传统的信息沟
期刊
【摘 要】 在当今建筑市场竞争日益激烈的和飞速发展下,墨守成规已经不能满足建筑企业对工程的要求和标准,从建设工程项目的角度出发,对建造师已经有了越累越严格及高的标准,从而提高建造师的素质和能力,对推进施工总承包工程项目管理,打造高端建筑产品起到了至关重要的作用。  【关键词】 人才管理;建造师;实践能力  一、建国几十年来,在工程建设领域,我国建筑业积累了极为丰富的经验,我国建筑业进入了欣欣向荣的
期刊
【摘 要】 本文集中论述了数控机床的主要应用特点与分类,并对数控加工中心做了较为详细的介绍,通过本文我们知道数控机床是由程序介质、数控装置、伺服系统、机床主体等部分组成。数控机床是采用数字控制技术对机床各移动部件的相对运动进行控制的机床,它是典型的机电一体化产品,是现代制造业的关键设备。数控机床综合了计算机、微电子、信息、自动控制、精密检测及机械制造技术等多门类的现代科学技术。与普通加工设备相比,
期刊
【摘 要】 在冶金、石油、化工等行业,现场设备及其相关设备应当采取相应的防爆措施。防爆技术以及本安系统的设计对于这个行业来说,就显得十分的重要。  【关键词】 仪表;本安防爆;本安系统  一、前言  本文通过在冶金、石油化工行业当中容易出现的防爆现象进行了分析,首先从爆炸产生的条件进行分析,然后对危险场所区域等级进行了划分,根据本安防爆系统、技术特点进行了研究,对于本安全防范技术在现代工业自动化控
期刊
【摘 要】 随着当前水质富营养化程度的加剧,需要我们对污水进行脱氮除磷处理,以减轻污水的污染,本文就污水处理厂脱氮除磷的运行控制进行阐述。  【关键词】 污水处理;脱氮除磷;运行控制  一、前言  随着当前人们生活和生产水平的不断提高,排放出大量的工业废水和生活污水,污水中含有大量的氮、磷等物质,直接排放会对水体造成污染,当前不同的污水处理单位运用脱氮、除磷的工艺有所不同,达到的效果也不相同。下面
期刊
【摘 要】 加强对桥面沥青混凝土相关病害的认识,重视对其结构破坏机理和设计理论方面的研究,已经刻不容缓。本文作者结合多年来的工作经验,对沥青混凝土桥面铺装早期病害原因进行了研究,具有重要的参考意义。  【关键词】 桥面铺装层;病害;原因;施工;处理  1 前言  随着目前车流量的逐步增加以及重型车辆的不断增加,桥面的铺装问题不断的出现,致使桥面铺装病害成了普遍现象,不仅影响正常的交通,特别在城市中
期刊
【摘 要】 为了有效实现建筑施工现场的安全管理,就必须坚持安全第一的原则,采取预防和综合治理的方式,切实地做好施工现场的安全管理工作,为建筑施工质量提供保障。本文主要对如何加强建筑施工现场安全管理进行了分析探讨。  【关键词】 建筑施工;现场安全;存在问题;应对措施  引言:  在建筑施工中,施工现场的安全管理与建筑工程的质量与成本管理是同等重要的,安全管理的效率与工程质量与成本直接相连,高水平的
期刊
【摘 要】 随着我国社会经济的不断发展,沥青公路应用在公路基础设施的建设上得到了长足的发展,但是沥青路面水损害问题也成为了沥青路面的主要问题之一,本文就沥青路面水损害原因进行深入的分析和探讨,并提供一些可供参考的防治措施与意见。  【关键词】 沥青路面;水损害;原因分析;防治措施  前言:  沥青路面的水损害破坏是指沥青路面在水分存在的条件下,经受温度胀缩和交通荷载的反复作用,一方面水分逐渐渗入到
期刊
【摘 要】 随着我国社会经济的快速发展,我国的工程地质钻探技术也逐渐呈现出新的发展趋势。本文重点探讨了我国的工程地质钻探技术的发展及设备选型方面的內容,具体包括工程地质钻探的适用条件、发展趋势及设备选型。  【关键词】 工程地质;钻探技术;设备选型  引言:  从建国起到现在,我国的工程地质钻探技术取得了非常显著的成就,而工程地质钻探技术的发展和进步通常会受到社会进步、科技发展及岩石破碎理论等的影
期刊
【摘 要】 红外分光光度法,作为国家标准方法,具有灵敏度高、适用范围广等优点,但在分析过程中还存在一些问题,依据大量的对实际样品的实验分析,从方法萃取次数、萃取剂定容,乳化现象、萃取液脱水以及石油类和动植物油的分离等方面提出几点探讨说明。  【关键词】 红外分光光度法;石油类;萃取  引言:  目前我国使用的石油类动植物油分析方法主要有重量法和红外分光光度法。重量法是常用的分析方法,不受油品的限制
期刊