论文部分内容阅读
【摘要】当前,随着互联网和移动通信的高速发展,开放文献资源呈现出动态、异构、高维和海量等新的特征,使得科研人员处于开放文献数字资源的包围之中,但要找到自己所需的开放文献信息反而变得比较困难。传统的开放文献资源的获取、分析和管理方法已经难以满足大规模、高质量、深层次知识获取需求,公共文献资源管理组织逐渐转向利用信息可视化技术的相关成果,本文聚焦于进一步改善开放文献资源的管理和利用,提出开放文献资源的可视化分析模型,全面提高开放文献资源管理的质量和效率。
【关键词】大数据;开放文献资源;信息可视化
1.引言
“开放存储”是在网络环境下发展起来的一种新的重要学术交流模式,它是国际学术界、出版界、图书情报界为打破商业出版者对学术信息的垄断和暴利经营,而采取的推动科研成果通过Internet免费或低价地、自由利用的运动。开放存储式的科技文献信息资源(简称为开放文献资源)是经过我国无数科技研究人员多年知识积累的成果记录,是他们多年科研心血和科技智慧的结晶,因此,成为国家的一种重要战略资源,对其进行有效管理和综合利用是推动我国科研积累和科技创新、社会向前发展的重要前提。因此,对开放文献资源的深入研究和综合利用,对促进利用互联网进行学术交流与出版,增加研究者获取可用学术资源的便利和准确率,提高科学研究成果的产出率具有重要的实践意义和应用价值。
信息可视化是信息的可视表征方式,在信息与人的交互过程中扮演着重要的角色。从用户的角度看,信息可视化过程的最终目标是帮助用户获取对信息的深入理解,帮助用户更好地表达对信息(知识)的理解。以用户为中心的信息可视化更大程度上是以可视化视图为手段的协作过程,体现了多用户共同参与下以可视化视图为媒介的信息感知、信息理解、信息分析、信息交流活动。因此,信息可视化的相关技术和成果应用到开放文献资源管理上,能较好地将开放文献资源的管理和分析上升到知识处理的层面,对提升区域开放文献平台的共享和集成、开放文献资源的综合利用具有非常重要的现实意义。
2.国内外研究现状
信息技术革命改变了文献资源建设赖以存在的社会信息环境,网络环境下丰富的信息资源为开放文献的资源建设奠定了基础。面对日益一体化的信息资源网络,传统文献管理模式和方法不得不重新定位,开放文献资源的电子化、数字化、虚拟化與网络化已成为时代发展的必然趋势。其中可视化技术的引入推进了开放文献资源的可视化表达和动态交互,帮助用户直观、准确地获取所需的文献信息资源,并加深对文献的深入理解。近年来人们对该领域的研究主要集中到异构环境下开放文献资源的组织管理、可视化建模等方面,现对国内外文献进行综合并分析如下:
1)信息可视化研究进展
从科学计算可视化到数据可视化,到信息可视化,再到知识可视化,关于可视化技术的研究不断深入,来自计算机领域、信息管理领域以及其它研究领域中的大量专家学者投入到可视化技术的研究和应用中。Eppler与Burkhard将信息可视化技术分为7种类型,还提出了可视化框架和模型,并将知识可视化定义为“利用可视化方式表示知识,以促进群体之间的知识传播和创新”。Burkhard以视觉认知与情报交流为基础理论,详细论述了可视化技术在信息传播过程中的作用,试图以信息传播为纽带探讨可视化技术与信息资源管理的结合。杨峰博士研究了信息可视化的系统框架,并将可视化技术分为信息属性可视化、信息结构可视化及高维信息可视化三种类型,还提出一种用于高维信息可视化的中心优先顺序降维方法。此外,最近十几年的应用和研究,产生了大量的可视化技术,业界开发了一系列开源的可视化工具包,包括Prefuse、Piccolo、IVC及InfoVis等,大大推进了可视化技术的开发应用。
2)信息管理中引入可视化技术的研究
近年来,可视化技术不断被引入到信息资源管理中来,用以改善信息资源管理中的过程不可见,资源检索效率和质量不高等问题。周宁教授带领研究团队在这方面做了大量的有益探索,将可视化技术应用到信息资源管理的多个环节包括信息组织、信息检索、信息分析等,并建立了通用信息资源管理的可视化模型,且在数字图书馆、电子商务、电子政务等方面进行了应用研究。董慧教授在实现基于本体的数字图书馆检索模型时,使用可视化插件TouchGraph实现了语义模块的输出,并探讨了本体可视化问题,给出了相应的方法和思路。靖培栋等则使用开源代码HyperTree实现了基于双曲几何的《中国图书馆分类法》分类体系的可视化。马费成教授分析了可视化建模在知识管理领域的应用等。
可见,将可视化技术融入到开放文献资源的组织和管理过程,构建其可视化管理模型与方法,使用户能够直观、快速、准确地获取和应用开放文献资源的成果,更好地实现对开放文献资源的综合管理和利用。
3.大数据环境下开放文献资源的可视化模型
针对开放文献资源呈现出动态、异构、高维和海量等新的特征,在分析开放文献资源内部结构及文献间存在的关联关系基础上,对开放文献资源的可视化管理模型及方法展开研究,探索异构环境下开放文献资源的组织、交互式可视化管理,开放文献资源的可视化管理建模等问题,从而解决开放文献资源组织过程不可见、用户参与度不高、资源检索结果的表示形式不便于交流等缺点。
3.1 模型构建
开放文献资源管理的可视化建模与分析过程也即是用户参与下的交互式过程,是以用户为中心的活动,离不开用户的参与。通过群体感知,工作区感知与信息交流理论,我们可从主体与开放文献资源挖掘的交互过程中抽象出可视感知、可视交流和可视挖掘三个环节,实现对开放文献资源的分析和管理过程。进而结合开放存储文献资源的结构和可视化建模原理,构建出大数据环境下开放文献资源的可视化管理模型,如图1所示。
从图1中,我们可以从上图中明确我们对开放文献资源的可视化分析和管理的模式,通过分解为相关的典型活动,应用UML建模工具进行可视化建模,在此基础之上实现对开放资源的可视化分析、挖掘和管理过程。 3.2 开放文献资源管理
3.2.1 异构环境下开放文献资源组织
主题聚类方法作为信息资源的一种组织模式,是将主题法与聚类方法结合形成的一种特殊的知识组织方法。我们通过对异构环境下的开放文献资源对象进行采集和结构转换,屏蔽其异构特性,并提取文献的特征,依据文献特征值进将聚类对象转换为基于主题的表示形式,从而达到降低特征空间维度和进行主题控制与语义理解的目的。通过深入分析文献间的特征关联关系,以可视化建模的展示,从而直观、清晰地展现文献资源之间的关联关系。
3.2.2交互式可视化过程中典型活动管理
开放文献资源管理的可视化建模与分析过程也即是用户参与下的交互式过程,是以用户为中心的活動,离不开用户的参与,其交互过程中的信息可视化包含三个典型活动:可视感知、可视分析、可视交流。这三个活动彼此相互联系,“感知”对应认知的低级阶段,简单的感受到中间挖掘结果可视化视图传达的信息;“分析”对应认知的高级阶段,在感知的基础上还要通过人的心智模型和隐性知识,对可视化视图进行分析,得到分析结果;“交流”则是交互式可视化模型过程的内在要求,因为没有交流就无法完成交互,难以实现中间挖掘结果的可视化结果的共享。
3.2.3开放文献资源的可视化挖掘过程管理
通过分析开放文献资源内部数据项集及文献间存在的关联关系,提取开放文献资源中的关联规则,基于关联规则设计面向开放文献资源的可视化挖掘方法,使用户可以更方便、深入地对挖掘结果进行可视化管理和分析,并依据中间挖掘结果快速调整用户感兴趣的参数,优化异构环境下开放文献资源挖掘的可视化管理过程并改善挖掘质量。
3.2.4开放文献资源的可视化管理
传统的信息资源管理采用分类体系组织,以纯文本的方式来描述,显然不能满足目前的要求。我们采用信息管理、可视化技术和建模原理,从静态和动态两个视角刻画开放文献资源的可视化管理过程,静态模型涉及可视化过程基本要素,各要素的特征以及相互关系;动态模型是对多用户进行交互式可视化过程的抽象,包括协作过程、协作活动及各个活动间的演化关系。从而为用户提供直观、快捷和准确的开放文献资源服务,提高开放文献资源的管理和利用效率。
4.结论
本文针对开放文献资源呈现出动态、异构、高维和海量等新的特征,聚焦于进一步改善开放文献资源的管理和利用,提出开放文献资源的可视化分析模型,实现对开放资源的可视化分析、挖掘和管理过程,从而全面提高开放文献资源管理的质量和效率。
参考文献:
[1]张红.基于开放获取的高校图书馆服务创新研究[J].农业图书情报学刊,2014,第6期
[2]李强.图书馆电子资源建设在开放存取领域的探索[J].内蒙古科技与经济,2013,第22期
[3]张会平,周宁. 基于可视化技术的知识转化框架研究. 情报理论与实践. 2008
[4]张学福. 基于概念图的知识模型组织及协作机制研究——以CmapTools 为例. 现代图书情报技术, 2005
作者简介:郑蕙(1978—),女,湖南长沙人,湖南商学院旅游管理学院教师,研究方向:旅游管理、领域大数据、产业经济。
基金项目:湖南省教育厅人文社科项目 (11C0752)。
【关键词】大数据;开放文献资源;信息可视化
1.引言
“开放存储”是在网络环境下发展起来的一种新的重要学术交流模式,它是国际学术界、出版界、图书情报界为打破商业出版者对学术信息的垄断和暴利经营,而采取的推动科研成果通过Internet免费或低价地、自由利用的运动。开放存储式的科技文献信息资源(简称为开放文献资源)是经过我国无数科技研究人员多年知识积累的成果记录,是他们多年科研心血和科技智慧的结晶,因此,成为国家的一种重要战略资源,对其进行有效管理和综合利用是推动我国科研积累和科技创新、社会向前发展的重要前提。因此,对开放文献资源的深入研究和综合利用,对促进利用互联网进行学术交流与出版,增加研究者获取可用学术资源的便利和准确率,提高科学研究成果的产出率具有重要的实践意义和应用价值。
信息可视化是信息的可视表征方式,在信息与人的交互过程中扮演着重要的角色。从用户的角度看,信息可视化过程的最终目标是帮助用户获取对信息的深入理解,帮助用户更好地表达对信息(知识)的理解。以用户为中心的信息可视化更大程度上是以可视化视图为手段的协作过程,体现了多用户共同参与下以可视化视图为媒介的信息感知、信息理解、信息分析、信息交流活动。因此,信息可视化的相关技术和成果应用到开放文献资源管理上,能较好地将开放文献资源的管理和分析上升到知识处理的层面,对提升区域开放文献平台的共享和集成、开放文献资源的综合利用具有非常重要的现实意义。
2.国内外研究现状
信息技术革命改变了文献资源建设赖以存在的社会信息环境,网络环境下丰富的信息资源为开放文献的资源建设奠定了基础。面对日益一体化的信息资源网络,传统文献管理模式和方法不得不重新定位,开放文献资源的电子化、数字化、虚拟化與网络化已成为时代发展的必然趋势。其中可视化技术的引入推进了开放文献资源的可视化表达和动态交互,帮助用户直观、准确地获取所需的文献信息资源,并加深对文献的深入理解。近年来人们对该领域的研究主要集中到异构环境下开放文献资源的组织管理、可视化建模等方面,现对国内外文献进行综合并分析如下:
1)信息可视化研究进展
从科学计算可视化到数据可视化,到信息可视化,再到知识可视化,关于可视化技术的研究不断深入,来自计算机领域、信息管理领域以及其它研究领域中的大量专家学者投入到可视化技术的研究和应用中。Eppler与Burkhard将信息可视化技术分为7种类型,还提出了可视化框架和模型,并将知识可视化定义为“利用可视化方式表示知识,以促进群体之间的知识传播和创新”。Burkhard以视觉认知与情报交流为基础理论,详细论述了可视化技术在信息传播过程中的作用,试图以信息传播为纽带探讨可视化技术与信息资源管理的结合。杨峰博士研究了信息可视化的系统框架,并将可视化技术分为信息属性可视化、信息结构可视化及高维信息可视化三种类型,还提出一种用于高维信息可视化的中心优先顺序降维方法。此外,最近十几年的应用和研究,产生了大量的可视化技术,业界开发了一系列开源的可视化工具包,包括Prefuse、Piccolo、IVC及InfoVis等,大大推进了可视化技术的开发应用。
2)信息管理中引入可视化技术的研究
近年来,可视化技术不断被引入到信息资源管理中来,用以改善信息资源管理中的过程不可见,资源检索效率和质量不高等问题。周宁教授带领研究团队在这方面做了大量的有益探索,将可视化技术应用到信息资源管理的多个环节包括信息组织、信息检索、信息分析等,并建立了通用信息资源管理的可视化模型,且在数字图书馆、电子商务、电子政务等方面进行了应用研究。董慧教授在实现基于本体的数字图书馆检索模型时,使用可视化插件TouchGraph实现了语义模块的输出,并探讨了本体可视化问题,给出了相应的方法和思路。靖培栋等则使用开源代码HyperTree实现了基于双曲几何的《中国图书馆分类法》分类体系的可视化。马费成教授分析了可视化建模在知识管理领域的应用等。
可见,将可视化技术融入到开放文献资源的组织和管理过程,构建其可视化管理模型与方法,使用户能够直观、快速、准确地获取和应用开放文献资源的成果,更好地实现对开放文献资源的综合管理和利用。
3.大数据环境下开放文献资源的可视化模型
针对开放文献资源呈现出动态、异构、高维和海量等新的特征,在分析开放文献资源内部结构及文献间存在的关联关系基础上,对开放文献资源的可视化管理模型及方法展开研究,探索异构环境下开放文献资源的组织、交互式可视化管理,开放文献资源的可视化管理建模等问题,从而解决开放文献资源组织过程不可见、用户参与度不高、资源检索结果的表示形式不便于交流等缺点。
3.1 模型构建
开放文献资源管理的可视化建模与分析过程也即是用户参与下的交互式过程,是以用户为中心的活动,离不开用户的参与。通过群体感知,工作区感知与信息交流理论,我们可从主体与开放文献资源挖掘的交互过程中抽象出可视感知、可视交流和可视挖掘三个环节,实现对开放文献资源的分析和管理过程。进而结合开放存储文献资源的结构和可视化建模原理,构建出大数据环境下开放文献资源的可视化管理模型,如图1所示。
从图1中,我们可以从上图中明确我们对开放文献资源的可视化分析和管理的模式,通过分解为相关的典型活动,应用UML建模工具进行可视化建模,在此基础之上实现对开放资源的可视化分析、挖掘和管理过程。 3.2 开放文献资源管理
3.2.1 异构环境下开放文献资源组织
主题聚类方法作为信息资源的一种组织模式,是将主题法与聚类方法结合形成的一种特殊的知识组织方法。我们通过对异构环境下的开放文献资源对象进行采集和结构转换,屏蔽其异构特性,并提取文献的特征,依据文献特征值进将聚类对象转换为基于主题的表示形式,从而达到降低特征空间维度和进行主题控制与语义理解的目的。通过深入分析文献间的特征关联关系,以可视化建模的展示,从而直观、清晰地展现文献资源之间的关联关系。
3.2.2交互式可视化过程中典型活动管理
开放文献资源管理的可视化建模与分析过程也即是用户参与下的交互式过程,是以用户为中心的活動,离不开用户的参与,其交互过程中的信息可视化包含三个典型活动:可视感知、可视分析、可视交流。这三个活动彼此相互联系,“感知”对应认知的低级阶段,简单的感受到中间挖掘结果可视化视图传达的信息;“分析”对应认知的高级阶段,在感知的基础上还要通过人的心智模型和隐性知识,对可视化视图进行分析,得到分析结果;“交流”则是交互式可视化模型过程的内在要求,因为没有交流就无法完成交互,难以实现中间挖掘结果的可视化结果的共享。
3.2.3开放文献资源的可视化挖掘过程管理
通过分析开放文献资源内部数据项集及文献间存在的关联关系,提取开放文献资源中的关联规则,基于关联规则设计面向开放文献资源的可视化挖掘方法,使用户可以更方便、深入地对挖掘结果进行可视化管理和分析,并依据中间挖掘结果快速调整用户感兴趣的参数,优化异构环境下开放文献资源挖掘的可视化管理过程并改善挖掘质量。
3.2.4开放文献资源的可视化管理
传统的信息资源管理采用分类体系组织,以纯文本的方式来描述,显然不能满足目前的要求。我们采用信息管理、可视化技术和建模原理,从静态和动态两个视角刻画开放文献资源的可视化管理过程,静态模型涉及可视化过程基本要素,各要素的特征以及相互关系;动态模型是对多用户进行交互式可视化过程的抽象,包括协作过程、协作活动及各个活动间的演化关系。从而为用户提供直观、快捷和准确的开放文献资源服务,提高开放文献资源的管理和利用效率。
4.结论
本文针对开放文献资源呈现出动态、异构、高维和海量等新的特征,聚焦于进一步改善开放文献资源的管理和利用,提出开放文献资源的可视化分析模型,实现对开放资源的可视化分析、挖掘和管理过程,从而全面提高开放文献资源管理的质量和效率。
参考文献:
[1]张红.基于开放获取的高校图书馆服务创新研究[J].农业图书情报学刊,2014,第6期
[2]李强.图书馆电子资源建设在开放存取领域的探索[J].内蒙古科技与经济,2013,第22期
[3]张会平,周宁. 基于可视化技术的知识转化框架研究. 情报理论与实践. 2008
[4]张学福. 基于概念图的知识模型组织及协作机制研究——以CmapTools 为例. 现代图书情报技术, 2005
作者简介:郑蕙(1978—),女,湖南长沙人,湖南商学院旅游管理学院教师,研究方向:旅游管理、领域大数据、产业经济。
基金项目:湖南省教育厅人文社科项目 (11C0752)。