大数据影响下的知识服务应用模式之变革

来源 :新世纪图书馆 | 被引量 : 0次 | 上传用户:zhh6622692
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 论文针对大数据知识服务问题开展研究。在对国内外相关研究综合述评的基础上,剖析大数据引发的知识服务应用模式之变革,主要表现为知识服务内容和知识服务方式的变革;进而构建大数据影响下的知识服务应用新模式逻辑框架,并分析其关键技术。研究结论认为应建立大数据环境下的知识服务应用新模式,目的是为提升大数据知识服务的价值和水平,实现知识共享提供新的思路和参考借鉴。
  关键词 大数据 知识服务 知识共享 应用模式
  分类号 G252
  Abstract This paper researches knowledge service of big data. Based on the comprehensive description and evaluation of domestic and abroad research documents, it analyzes the changes of knowledge service application model caused by big data, which represents knowledge service contents and modes’ changes. Also the logic frame of knowledge service new application model affected by big data is constructed and its key technologies are analyzed. The research conclusion believes that new knowledge service application model should be constructed under big data environment. The research aim is to provide new thinking and references for prompting the value and level of big data knowledge service and realizing the knowledge sharing.
  Keywords Big Data. Knowledge Service. Knowledge sharing. Application model.
  1 国内外研究现状述评及选题价值
  1.1 目前国内外相关研究简单回顾
  新信息技术的发展和用户需求的变化促使现代互联网逐渐向高附加值的知识创新型服务延伸和扩展,大数据时代的到来使得“面向大数据的知识服务”这一主题日益受到人们的关注。一般认为,大数据技术是从各类型的数据中快速获得有价值信息的能力之技术,其具备走向众多企业的潜力[1]。英国伦敦奥运会采用大数据技术监测网络安全[2];日本重视大数据应用,强化ICT领域国际竞争力[3]。美国推进“大数据”的研究和应用实践主要表现在三方面:(1)政府主导,全体动员,支持大数据的研发。美国奥巴马政府在2012年2月宣布推出“大数据的研究和发展计划”,又于3月29日在美国白宫网站发布了《大数据研究和发展倡议》(Big Data Research and Development Initiative)[4],计划在六家政府部门的协作下,倡导全民大力推动及改善与大数据相关的采集、组织、分析、决策等工作。(2)非营利性组织和教育机构积极利用大数据开展公共服务。大数据的兴起和发展给美国各类非营利性组织开展公共服务提供了良好的机遇,如“数据无边界运动”(Data Without Borders Movement)通过收集大量的数据并加以分析,借助信息可视化技术为公益性服务提供帮助;美国的高等院校已着手开始培育与大数据相关的高级人才,其中有大学已开设与大数据相关的新课程[5]。(3)图书馆界积极响应,研究和尝试应用大数据。如,美国哈佛大学图书馆已将“大数据”的服务引入图书馆中并付诸实践,将图书大数据向读者公布[6];美国俄亥俄州经营电子书、有声读物的经销商OverDrive公司通过“Buy It Now网上商店”等渠道为图书馆提供其所不具备的书目记录,也为读者开辟了发现新图书的途径[7]。另外,国外对知识服务的研究也呈方兴未艾之势;通过检索OCLC First Search中Article First(学术论文数据库)得知,目前的研究一般偏重于图书馆,特别是高校图书馆知识服务的实施尝试;也有研究知识推荐服务的文献,如Netflix推出的基于大数据分析的个性化推荐系统架构[8]、阿里云推出的基于内容和行为的智能云推荐体系[9]。
  就国内来说,大数据正逐渐成为学术界的关注热点。我国工程院院士李国杰先生指出,大数据将成为信息科技的新关注点,并可能形成新型交叉学科——网络数据科学[10]。根据检索结果分析,可总结出我国大数据研究呈现的主要特点为:(1)论文数量呈逐年上升趋势。2012年专门研究大数据的文献开始出现,2013年激增,2014年继续保持增长势头。(2)发表的论文主要集中在计算机类和管理类期刊。近年来图书情报学期刊也刊载有一些大数据的文章,昭示学科的交叉研究之趋势。(3)研究视角多样化、研究的重点较突出。刊载在计算机类刊物上的论文主要侧重于大数据的技术架构和设计,而管理类刊物则侧重于大数据的理论探讨和现实借鉴等。(4)对大数据的应用实践研究不太重视。目前国内的研究普遍重理论,轻实践。
  1.2 简要评述及选题价值
  目前国内外针对大数据和知识服务的研究热潮对于我们有效开展大数据时代的知识服务方式创新提供了崭新的思路,对图书馆等服务机构提升知识服务水平具有较大的理论价值和现实参考意义;同时对图书馆学情报学研究范式的转变也具有积极作用。但仍存在一些缺陷,主要表现在:对大数据的整体研究实力不太强,研究力量较分散;研究中重理论、轻实践,缺乏实证研究;部分研究内容前后重复,缺乏创意;研究者给出的解决策略一般比较模糊,尚需要进一步的实践验证。而令人更感遗憾的是,目前缺乏大数据与知识服务应用模式相结合的综合研究。大数据时代的到来呼唤适应大数据处理需求的新型知识服务应用模式出现,笔者以此为切入点选题,研究成果可为大数据和新型知识服务应用模式的交叉研究提供有益的借鉴,对于进一步完善面向大数据的知识服务应用模式这一领域的研究提供理论参考价值。   2 大数据引发的知识服务应用模式之变革
  《中国计算机报》的报道认为,大数据催生数据多样化的服务形态,大数据的应用方式是从数据服务、信息服务到知识服务[11]。大数据固有的特性赋予知识服务新的内涵和特征,并引发知识服务应用模式之变革,主要表现在知识服务内容的变革和知识服务方式的变革。
  2.1 知识服务内容的变革
  虽然业界对大数据的认识尚未完全统一,但我们可以这样简单地理解:大数据技术即是从各类型的数据中快速获得有价值信息的能力之技术。大数据不同于海量数据的概念,它与目前的数据库技术也存在差异,其对比如表1所示[12]。
  大数据环境下,如何有效组织和管理好大规模的数据,并有效利用大数据加以分析、推理来获取新的知识,这是目前摆在科技工作者面前的重要课题
  表1 大数据与目前数据库技术的比较
  之一。大数据时代,互联网、电子商务、科学研究等领域将涌现出各类非结构化、半结构化以及复杂结构化的大量数据,用户的数据处理需求和知识需求将会大量增加,数据作为社会资源的重要部分将日益被重视;基于大数据的存储、分析、挖掘等服务将逐渐得到开展和应用,这使得大数据知识服务模式得以产生并逐渐被社会公众所接受。大数据将拓宽知识服务的内涵、外延,引发知识服务内容的变革。大数据影响下的知识服务体现在大数据处理过程中对知识资源、服务、过程等的知识服务配置和整合能力,反映知识服务机构在提供相应领域服务和完成预期目标及任务的总体水平;包含资源、数据、知识、服务、过程、能力和任务等七个因素。由此可见,传统知识服务的内容将随着大数据的驱动而发生较大改变。学者李晨晖等人将大数据知识服务界定为:“大数据知识服务是为适应信息服务业智慧化、协作化、绿色化、先觉化和泛在化的发展趋势而衍生的一种基于网络、用以解决结构化、半结构化及非结构化数据多维度处理的信息服务新模式。”[13]大数据知识服务是一种面向海量数据,并提供智慧服务的知识服务新模式,具有一些典型特征,如:积极强调用户参与;基于知识、能力、资源、过程共享和交易开展知识服务;提高知识增值价值;强调群体创新和自主需求等[14]。
  2.2 知识服务方式的变革
  大数据的显著特征是价值(Value)大,而该特征的直接体现则在于从纷繁芜杂的海量数据中提炼有价值的知识和规律。人类社会的数据正以十分惊人的速度不断增加和积累,大数据环境下的知识服务不能局限于传统的信息服务,而应与大数据的爆发式增长与社会化趋势同步。大数据引发知识服务方式的变革,主要集中在两个方面:数据清洗和知识咨询服务。所谓数据清洗是指在大数据中剔除一些噪声数据后,对余下的蕴含有价值的数据进行知识提取。数据清洗是提高数据质量的有效手段,也是提升知识服务效率的基础和有力保障。大数据的数据清洗在客观上对知识服务提出了新的要求,即大数据环境下的数据整合和数据关联。大数据容量大、内容丰富,结构异构,蕴含的知识多,但数据的繁杂使得其利用效率受到较大影响;数据整合有助于提高数据的使用价值和效率。另外,大数据影响下的知识服务必须将数据关联,因为彼此孤立的数据其价值不容易得到实现。通过数据关联,使大数据能为现实中的问题解决提供有价值的知识并建立知识关联机制,构建知识图谱,助推知识服务迈上新的台阶。知识咨询服务则是大数据知识服务的主要方式。大数据时代,信息资源的竞争力主要在于信息服务的知识化、专业化、数据分析与组织程度以及知识创新力;知识服务的最大价值判断标准是其提供的有价值知识含量。大数据为知识咨询服务提供丰富的数据资源和专业的数据分析技术,带来新的解决问题思维方式和更为广阔的合作视野[15]。我们应敏锐地看到大数据环境中的社会发展和用户服务需求,由资源依赖型服务向知识服务转变,并积极探索知识服务的新方式。
  3 大数据影响下的知识服务应用新模式逻辑架构
  大数据影响下的知识服务应用模式体现大数据生态系统对服务、资源和过程等的知识资源整合和配置能力,在大数据分析和处理过程中产生,并反映服务机构提供和完成相应领域、任务目标等的知识服务水平;大数据知识服务已成为新型知识服务模式发展的重要趋势,其理念和技术将逐渐引起学术界和产业界的密切关注。当前,知识形态、知识获取、知识交流及处理机制都面临着巨大的挑战,导致知识管理模式以及科技服务工作流的关键知识瓶颈发生重大变化。因此,面向大数据的知识服务被看作是应对上述挑战的重要突破口,是知识服务创新的关键。根据上述有关分析,笔者设计出大数据影响下的知识服务应用新模式逻辑框架,如图1所示。
  图1 大数据影响下的知识服务应用新模式逻辑框架
  由图1可知,大数据影响下的知识服务应用新模式逻辑框架主要由三大模块组成:大数据知识服务应用新模式组成、大数据知识服务应用新模式逻辑架构以及牵涉到的关键技术,三者通过大数据相互联系。大数据知识服务应用新模式强调数据、资源、知识、能力、服务、任务、过程等要素的有机融合,能满足结构化、半结构化和非结构化数据的复杂处理需求,实现大数据知识服务体系中的知识动态协调和管理,更好地满足用户的各类需求。大数据影响下的知识服务应用新模式逻辑架构主要包括五个方面:
  (1)大数据源及资源整合。提供大数据知识服务应用过程中所涉及的各类大数据来源和经整合的数据资源,其中移动互联网数据、电子商务数据、社交网络数据、传感器数据等将成为未来大数据在信息服务领域的主要来源。
  (2)大数据知识服务标准和规范。大数据范围非常之大,同时可能显得杂乱无章;要想很好地开展大数据知识服务,必须制定科学的大数据管理标准和知识服务规范等,如大数据分类和处理标准、大数据智能感知的识别标准、知识服务接入和描述规范、知识共享准则与大数据知识服务评价指标体系等。这是有效开展大数据知识服务的前提。
  (3)大数据知识服务基础支撑。这主要是提供和保障大数据知识服务所需要的硬件基础设施和网络支撑,如大数据服务器、分布式虚拟存储器、物联网资源及各类结构化、非结构化数据的存储等。   (4)大数据知识服务应用模式。这是大数据知识服务系统的核心,起承前启后的作用;主要有知识推荐、知识咨询、知识引擎、科研用户知识共享等模式。将接入到大数据知识服务系统的各类大数据源和处理任务、方案等整合、汇聚成虚拟的大数据知识服务资源,依据需要采取不同的大数据知识服务应用模式将大数据知识服务资源提供给不同的知识服务业务模型调用,引导用户的大数据处理需求和大数据知识服务资源交易,并根据用户的反馈评价作出相应的调整。
  (5)大数据知识服务质量评价。大数据知识服务应用模式是一种强调用户参与、面向智慧服务和需求、同时支持离线与实时数据处理、高效率与风险并存的大数据处理和知识服务模式。为了控制风险,应该建立大数据知识服务质量评价体系,将知识平台服务质量评价、服务体系评价以及知识机构服务质量评价三者有机结合起来,建立大数据知识服务的质量考核和监督机制。
  大数据作为时代的产物,必将促使用户产生更高、更现实的知识服务需求。大数据与知识服务的资源、能力和用户三方面的结合,促使人们探求知识服务新的增长点和突破点。大数据影响下的知识服务应用新模式逻辑框架所涉及的技术领域较为广泛,其中的关键技术主要有:大数据分析与处理技术,即对结构化、半结构化及非结构化数据的获取、组织存储、分析与处理技术等;大数据智能感知技术,即对RFID射频数据、传感器数据等的智能感知、网络传输、高效处理技术等;知识服务虚拟接入技术,即对大数据知识服务应用模式七要素(数据、资源、知识、能力、服务、任务、过程)等资源和能力的虚拟化接入技术;知识服务可视交互技术,即大数据知识服务系统平台与用户终端之间交互的可视化、智能化实现技术;知识服务安全可靠技术,即实现大数据知识服务安全、可靠运行的一系列方法和技术。大数据也并不是尽善尽美,它在改变我们思维模式的时候也带来了一系列问题与挑战:大数据分析预测的精准度问题、相关技术和成本的费用问题以及用户隐私保护和安全问题等等。囿于篇幅,笔者恕不详细展开论述。
  4 结语
  大数据环境下,科学研究范式、知识获取、交流和创新机制的变化导致传统的知识服务模式发生变革,信息服务形态也逐渐转向知识密集型服务;并从客观上要求适应大数据分析与处理需求的知识服务新应用模式的诞生。笔者基于大数据的有关理论,剖析其对知识服务模式的影响,在此基础上构建大数据影响下的知识服务应用新模式逻辑框架,并探讨其关键技术。这是一种有益的探索和尝试,目的是为构建大数据影响下的知识服务应用新模式,实现知识服务的交易和共享,进而提升大数据知识服务的价值和水平提供新的思路和参考借鉴。
  参考文献:
  [ 1 ] 维基百科.Big Data[EB/OL].[2014-08-08].http://www.en.wikipedia.org/wiki/Big Data.
  [ 2 ] Chris Petersen. Big data and the London Olympicscyber-security challenge[EB/OL].[2014-08-08].http://www. technewsworld.com/story/75754.html.
  [ 3 ] 王喜文.日本强化ICT领域国际竞争力[N].中国电子报,2012-06-15(003).
  [ 4 ] The White House. Big Data Across the Federal Government[EB/OL].[2014-08-08].http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_fact_sh-eet.pdf.
  [ 5 ] The Wall Street Journal. Big-Data Success Stories: Splunk[EB/OL].[2014-08-08].http://blogs.wsj.com/ve-nturecapital/2011/10/21/big-data-success-stories-s-plunk/.
  [ 6 ] The New York Times. Harvard Releases Big Data for Books[EB/OL].[2014-08-08].http://bits.blogs.nytimes.com/2012/04/24/Harvard-releases-big-data-for-books/
  [ 7 ] Spolanka. OverDrive announces a series of “Big Data”reports[EB/OL].[2014-08-08].http://www.libraries.wr-ight.edu/noshelfrequired/2012/04/11/overdrive-an-no-unces-a-series-of-big-data-reports/.
  [ 8 ] Xavier Amatrain,Justin Basilico.Netflix公布个性化和推荐系统架构[EB/OL].[2014-08-08].http://www.csdn.net/article/2013-04-04/2814767-netflix-ml-architecture.
  [ 9 ] 云推荐[EB/OL].[2014-08-08].http://tui.cnzz.com/.
  [10] 中国科学院.李国杰院士:大数据成为信息科技新关注点[EB/OL].[2014-08-08].http://www.cas.cn/xw/zjsd/201206/t20120627_3605350.shtml.
  [11] 李奕.大数据应用方式:从数据服务、信息服务到知识服务[N].中国计算机报,2012-07-09(024).
  [12] Big data:The next frontier for innovation,competition and productivity[EB/OL].[2014-08-08].http://www.mc-kinsey.com/Features/Big Data.
  [13] 李晨晖,崔建明,陈超泉.大数据知识服务平台构建关键技术研究[J].情报资料工作,2013(2):29-34.
  [14] 秦晓珠,李晨晖,麦范金.大数据知识服务的内涵、典型特征及概念模型[J].情报资料工作,2013(2):18-22.
  [15] 王天泥.知识咨询:大数据时代图书馆的知识服务增长点[J].图书与情报,2013(2):74-77.
  东 方 湖南衡阳师范学院图书馆副研究馆员。湖南衡阳,421008。
  ( 收稿日期:2014-08-28 编校:邹婉芬)
其他文献
【正】 为了推动外经贸领域的改革步伐,促进兄弟省市间的沟通与交流,4月16日—21日,外经贸企协中南片会议在郑州召开。到会代表57人,除湖南、湖北、广东、广西、海南5省外,还
为延缓鲜切双孢蘑菇褐变的发生,研究了不同真空度(0,-20,-40,-60,-80,-98k Pa)下充氮热处理对鲜切双孢蘑菇贮藏中的色泽以及过氧化物酶、多酚氧化酶、苯丙氨酸解氨酶和总酚含量
哈佛大学系慈善信托模式,其法律基础是1650年的特许状。其中,开办哈佛大学的资金是慈善信托财产;"哈佛学院的校长和评议员"是慈善信托共同受托人,是法人;哈佛大学是慈善信托执
近几年司法考试通过率有加速度提高之趋势,其在选拔不少法律人才的同时,也带来了一些负面影响,特别是降低了人才的素质。这其中既有认识方面的误区,也有制度设计方面的原因。
WTO争端解决专家组认为我国《版权法》第4条第1款完全否认了部分违禁作品的版权,未能履行版权保护最低标准的国家义务.也不符合知识产权实施措施的最低要求。WTO成员方基于公共
南京图书馆成功举办第六届阅读节《孟子》系列主题活动,阅读节期间举办内容丰富的活动,亮点突出,吸引广大民众的热情参与,激发他们阅读兴趣,增进对经典的了解,不仅有助于引导全民阅
论文从新疆少数民族特色数字资源库建设的背景和现状,在喀什建立维吾尔文史资源库的必要性,以及建立维吾尔文史资源库在计算机技术上的可行性等方面,对新疆喀什特区维吾尔文
台湾大学图书馆之数字典藏发展成果,主要可分为两部分:(1)台湾研究资料:淡新档案、伊能嘉矩手稿、台湾古碑拓本、田代安定手稿、歌仔册、狄宝赛文库;(2)台大专藏资产暨合作数字化:台
摘 要 OPAC历经数代发展,其整体功能有了一定的进步与完善,但是仍与读者需求相距甚远。针对目前OPAC存在的缺陷,借鉴国内外搜索引擎功能及网上书店的做法,论文指出目前OPAC运行中的不足,从普通用户功能整合视角出发,秉承以人性化服务为中心的理念,提出了新型OPAC应用发展方向,对新型OPAC应用系统的整体功能框架进行了科学、合理地设计。  关键词 OPAC 应用开发 系统集成 智能搜索  分类号
主要从五个主要方面来介绍秦山核电二期核电站压水堆型的安全保障体系,这五个方面包括核电站的设计特点、压水堆发生严重事故类型、电站辐射防护监督情况、秦山核电站安全运