论文部分内容阅读
摘 要:大数据是高校图书馆中药馆藏内容之一,其特征明显,影响深远,从大数据的内涵出发,本文阐述了大数据给高校图书馆带来的新挑战及新模式,并从不同的侧面分析了大数据如何管理才能为读者提供更好的服务,以达到大数据所提出的个性化、智慧化服务需求。
关键词:大数据;数据分析;数据描述;数据驱动
1 大数据的基本特征
大数据具有“海量、高速、易变”的特点,基本特征可用“五大”做简单概括。
一是数据体量大。互联网的数据、信息量已达到了前所未有的程度,总量每两年就增加一倍,大数据以全面渗透到高校图书馆中,现已成为图书馆馆藏资源的重要组成部分。
二是数据范围大。目前,高校图书馆馆藏资源早已不单单是文本形式,还包括网络、微博、视频、音頻、图片、邮件等大量电子资源数据,甚至包括虚拟馆藏等多媒体资源。大范围的数据资源,为未来移动图书馆的普及创造了先决条件。
三是数据变化大。所谓变化大,是说数据资源的类别与形式发生了巨大变化,许多数据从原来的文本数据变成了电子数据,从固态数据变身成了动态数据,数据种类繁多,给高校图书馆的资源构成带来了深刻变革。
四是数据移动大。由于以网络平台为传输途径和服务渠道的移动信息数据,大多以手机和平板电脑为工具,移动阅读、移动搜索、移动查询日益增多,医用移动设备所产生的交互与交流在不断加快。大数据里很多是实时数据,客观上促使图书馆处理数据要加速,分析处理应立竿见影。
五是数据价值大。很多最有价值、最有用的信息资源往往隐藏在大量的数据信息后面。尽管大数据能提供大价值,但价值总量并不能和信息总量成正比,因为很多无用信息也包含在大数据之中,像大浪淘沙一样,需过滤和冲洗才能找到“真金”,这恰恰是大数据给高校图书馆提出的挑战。
2 整合资源要靠大数据作支撑
信息时代使图书馆具有了大数据的特征,作为知识数据信息资源的集散地,图书馆应以大数据作支撑,为科学研究和科学创新营造良好环境,提供更多方便。在大数据背景下,一个图书馆几乎可以收集到所有的数据资源,但这些资源来自于不同的机构,不同的知识库,不同的读者个人,不一定直观的表现出数据本身的意义。不整合这些庞大的数据,就很难发挥出大数据的重大价值。因此,图书馆必须充分利用机构优势,完成对各类数据源的定位和连接,实现数据的采集、传输与汇集,同时利用各类数据资源的特点,逐步建立起数据的统一标准,通过对原数据的加工、整理和数据发布,建立起以数据资源汇集与融合为核心的知识库,并运用网络索引方式为读者提供内容丰富、格式统一,结构清晰的网络数据平台,进而实现数据共享的服务目标。
3 知识挖掘要靠大数据作分析
为读者提供快捷、简单、易用的资源发现和获取,是高校图书馆义不容辞的职责。而现今不断增长的数据共享与大数据管理需求,也为高校图书馆挖掘知识,提供高品质服务开辟了广阔天地。经验表明,推荐过滤算法是目前比较普遍又很成功的方法,这种方法以大数据的科学分析为前提,用最短的时间帮助读者,从海量的数据中快捷的发现并获取最有价值的资源。科学分析可按类分别展开,如按用户检索下载的文献特征,分析归纳出某个学科,在某个时期读者最感兴趣的主题,靠数据关联,数据挖掘,数据检验分别作出相关分析,回归分析和量化分析,以满足读者的迫切需求。如对科学热点预测和交叉学科的深入研究,通过展现学者、期刊、会议、文章之间的知识网络,并依赖大数据的有序处理进行学科趋势分析,为读者提供最实用的获取服务。总之,以大数据为细节的知识发现分析,是保证大数据增值的有效手段之一。
4 实用信息靠大数据做描述
由于大数据具有数量大、类型多、变化快的特性,为方便读者快速获取最有价值的实用信息,高校图书馆不仅要对数据做深入分析、归类,而且更需要对数据做出准确的定位和描述,以帮助读者从大数据中发现科学规律、经济规律和社会规律,这些规律的发现对读者来说就是最实用的信息,也是最有价值的潜在资源。因此,高校图书馆应依靠对大数据的准确描述,为读者提供一种全新的服务模式。所谓对大数据的准确描述,是指对大数据进行技术处理的手段或方法,达到更有效地组织、分析及利用信息的目的。当前,在高校图书馆比较推崇的有效方法便是信息可视化。这种方法对有效组织、揭示、掌握、利用信息作用十分明显。可视化可为读者提供一个方便、易用的知识环境。主题可视化,有利于描述检索结果和检索结果之间的关系;数据可视化,有利于描述潜藏的知识价值所在;时间分布可视化,有利于描述知识领域的发展趋势及走向;作者合作关系可视化,有利描述知识领域的结构与属性。
5 智慧服务靠大数据做驱动
大数据已渗透到图书馆的信息资源中,对读者的吸引力也将愈来愈大。大数据服务技术将成为读者与图书馆共同关注的热点。随着读者对知识需求的转变,个性化需求将被提升到突出位置,同时满足个性化需求也必将列入图书馆工作的重点之中。个性化需求实质上就是读者对知识信息使用行为习惯及对信息的特定需求。要满足个性化需求,图书馆就要在分析、预测读者个体信息需求的基础上,主动向所有读者提供其可能需求但又无法及时获取的信息资源。因为大数据的价值是隐藏在海量数据之后的,其规模庞大,变化不定,易给读者带来无所适从的困惑。所以,图书馆应凭借组织和专业优势,靠大数据驱动为读者提供智慧服务。因为图书馆有大数据存在而掌握着大量的读者行为信息数据。如读者查询书目产生的日志信息数据,读者借还书产生的流通数据,读者浏览下载电子资源产生的数据,用户访问产生的流量数据,以及各种媒体、网络产生的流通数据,利用这些数据,图书馆一方面可以了解读者的个人信息,另一方面还能发现读者带有规律性的需求,进而把握读者行为,做到定位准确,预测科学,使服务更贴近实际、更贴近读者。
参考文献:
[1]朱静薇,李红艳.大数据时代下图书馆的挑战及其应对策略[J].现代情报,2013.5.
[2]胡海鹰.大数据趋势下数字图书馆的服务创新策略[J].图书馆工作与研究,218期.
关键词:大数据;数据分析;数据描述;数据驱动
1 大数据的基本特征
大数据具有“海量、高速、易变”的特点,基本特征可用“五大”做简单概括。
一是数据体量大。互联网的数据、信息量已达到了前所未有的程度,总量每两年就增加一倍,大数据以全面渗透到高校图书馆中,现已成为图书馆馆藏资源的重要组成部分。
二是数据范围大。目前,高校图书馆馆藏资源早已不单单是文本形式,还包括网络、微博、视频、音頻、图片、邮件等大量电子资源数据,甚至包括虚拟馆藏等多媒体资源。大范围的数据资源,为未来移动图书馆的普及创造了先决条件。
三是数据变化大。所谓变化大,是说数据资源的类别与形式发生了巨大变化,许多数据从原来的文本数据变成了电子数据,从固态数据变身成了动态数据,数据种类繁多,给高校图书馆的资源构成带来了深刻变革。
四是数据移动大。由于以网络平台为传输途径和服务渠道的移动信息数据,大多以手机和平板电脑为工具,移动阅读、移动搜索、移动查询日益增多,医用移动设备所产生的交互与交流在不断加快。大数据里很多是实时数据,客观上促使图书馆处理数据要加速,分析处理应立竿见影。
五是数据价值大。很多最有价值、最有用的信息资源往往隐藏在大量的数据信息后面。尽管大数据能提供大价值,但价值总量并不能和信息总量成正比,因为很多无用信息也包含在大数据之中,像大浪淘沙一样,需过滤和冲洗才能找到“真金”,这恰恰是大数据给高校图书馆提出的挑战。
2 整合资源要靠大数据作支撑
信息时代使图书馆具有了大数据的特征,作为知识数据信息资源的集散地,图书馆应以大数据作支撑,为科学研究和科学创新营造良好环境,提供更多方便。在大数据背景下,一个图书馆几乎可以收集到所有的数据资源,但这些资源来自于不同的机构,不同的知识库,不同的读者个人,不一定直观的表现出数据本身的意义。不整合这些庞大的数据,就很难发挥出大数据的重大价值。因此,图书馆必须充分利用机构优势,完成对各类数据源的定位和连接,实现数据的采集、传输与汇集,同时利用各类数据资源的特点,逐步建立起数据的统一标准,通过对原数据的加工、整理和数据发布,建立起以数据资源汇集与融合为核心的知识库,并运用网络索引方式为读者提供内容丰富、格式统一,结构清晰的网络数据平台,进而实现数据共享的服务目标。
3 知识挖掘要靠大数据作分析
为读者提供快捷、简单、易用的资源发现和获取,是高校图书馆义不容辞的职责。而现今不断增长的数据共享与大数据管理需求,也为高校图书馆挖掘知识,提供高品质服务开辟了广阔天地。经验表明,推荐过滤算法是目前比较普遍又很成功的方法,这种方法以大数据的科学分析为前提,用最短的时间帮助读者,从海量的数据中快捷的发现并获取最有价值的资源。科学分析可按类分别展开,如按用户检索下载的文献特征,分析归纳出某个学科,在某个时期读者最感兴趣的主题,靠数据关联,数据挖掘,数据检验分别作出相关分析,回归分析和量化分析,以满足读者的迫切需求。如对科学热点预测和交叉学科的深入研究,通过展现学者、期刊、会议、文章之间的知识网络,并依赖大数据的有序处理进行学科趋势分析,为读者提供最实用的获取服务。总之,以大数据为细节的知识发现分析,是保证大数据增值的有效手段之一。
4 实用信息靠大数据做描述
由于大数据具有数量大、类型多、变化快的特性,为方便读者快速获取最有价值的实用信息,高校图书馆不仅要对数据做深入分析、归类,而且更需要对数据做出准确的定位和描述,以帮助读者从大数据中发现科学规律、经济规律和社会规律,这些规律的发现对读者来说就是最实用的信息,也是最有价值的潜在资源。因此,高校图书馆应依靠对大数据的准确描述,为读者提供一种全新的服务模式。所谓对大数据的准确描述,是指对大数据进行技术处理的手段或方法,达到更有效地组织、分析及利用信息的目的。当前,在高校图书馆比较推崇的有效方法便是信息可视化。这种方法对有效组织、揭示、掌握、利用信息作用十分明显。可视化可为读者提供一个方便、易用的知识环境。主题可视化,有利于描述检索结果和检索结果之间的关系;数据可视化,有利于描述潜藏的知识价值所在;时间分布可视化,有利于描述知识领域的发展趋势及走向;作者合作关系可视化,有利描述知识领域的结构与属性。
5 智慧服务靠大数据做驱动
大数据已渗透到图书馆的信息资源中,对读者的吸引力也将愈来愈大。大数据服务技术将成为读者与图书馆共同关注的热点。随着读者对知识需求的转变,个性化需求将被提升到突出位置,同时满足个性化需求也必将列入图书馆工作的重点之中。个性化需求实质上就是读者对知识信息使用行为习惯及对信息的特定需求。要满足个性化需求,图书馆就要在分析、预测读者个体信息需求的基础上,主动向所有读者提供其可能需求但又无法及时获取的信息资源。因为大数据的价值是隐藏在海量数据之后的,其规模庞大,变化不定,易给读者带来无所适从的困惑。所以,图书馆应凭借组织和专业优势,靠大数据驱动为读者提供智慧服务。因为图书馆有大数据存在而掌握着大量的读者行为信息数据。如读者查询书目产生的日志信息数据,读者借还书产生的流通数据,读者浏览下载电子资源产生的数据,用户访问产生的流量数据,以及各种媒体、网络产生的流通数据,利用这些数据,图书馆一方面可以了解读者的个人信息,另一方面还能发现读者带有规律性的需求,进而把握读者行为,做到定位准确,预测科学,使服务更贴近实际、更贴近读者。
参考文献:
[1]朱静薇,李红艳.大数据时代下图书馆的挑战及其应对策略[J].现代情报,2013.5.
[2]胡海鹰.大数据趋势下数字图书馆的服务创新策略[J].图书馆工作与研究,218期.