论文部分内容阅读
【摘要】 以CNKI中收录的主题词是“双一流”建设、高校质量监测的相关研究论文为研究样本,借助可视化软件CiteSpace V,绘制出有关这个主题的研究热点、研究前沿的知识图谱。运用关键词共现分析法呈现我国双一流建设、高校质量监测研究的热点;运用突变词检索算法查找突变词及突变率,揭示行业研究前沿。
【关键词】 “双一流”建设 高校质量监测研究 共现分析 突变词CiteSpace V近年来,各级政府和各地高校都非常关注两件事情,一是“世界一流大学,世界一流学科”(简称“双一流”)的建设,另一件是高校质量监测。2015年10月24日,国务院印发《统筹推进世界一流大学和一流学科建设总体方案》,要求按照“四个全面”战略布局和党中央、国务院决策部署,坚持以中国特色、世界一流为核心,以立德树人为根本,以支撑创新驱动发展战略、服务经济社会发展为导向,坚持“以一流为目标、以学科为基础、以绩效为杠杆、以改革为动力”的基本原则,加快建成一批世界一流大学和一流学科。双一流建设及与之相关的高校质量监测是我们当前关注的热点和焦点。与之而来的我们很关心近来学者们对此都进行了哪些研究,研究的核心是什么,研究的热点是什么,研究的前沿是什么。而要回答这些问题无疑要借助现代的可视化研究技术。
本文借助现代可视化工具CiteSpace V,运用共现分析和突变词检索算法,结合中国知网数据,对双一流建设、高校质量监测的研究现状进行了剖析,希望能够给研究者在实际研究中提供帮助和参考。
一、研究工具及数据来源
(一)研究工具CiteSpace V简介
CiteSpace V是用来分析和可视共被引网络的Java程序,是一款应用于科学文献中识别并显示科学发展新趋势和新动态的软件。利用CiteSpace V可以寻找某一学科领域的研究进展和当前的研究前沿,及其对应的知识基础。
(二)数据来源
本文所用数據来自中国知网,检索方式是主题词检索,选取的主题词是“双一流”建设或高校质量监测。共搜索到2015-2017年文献496篇,其中2015年2篇,2016年232篇,2017年263篇。下载时对数据进行了预处理和清洗。主要工作包括去除公告、通信信息,删除未标注作者引用以及网络引用,以及根据 CiteSpace V数据格式进行了数据转化。
二、研究热点探析
(一)共现分析的研究方法
共现分析(Co-occurrence analysis)是一种内容分析方法,是将各种信息载体中的共现信息定量化的分析方法,以解释信息的内容联系和特征项所隐含的寓意,被广泛用于知识发现的研究中。它的方法论基础是心理学的临近联系法则和知识结构及映射原则。共同出现的特征项之间一定存在着某种关联,关联程度可用共现频次来测度。利用共现关系绘制某一领域的知识图谱,能够以可视化的方式来探测该领域的研究热点和研究前沿,纵向和横向分析展示相关领域的发展进程、主题结构以及未来发展趋势,反映当前科学研究水平,展示其研究主题的变迁,进而实现预测关注的主题的趋势,实现关注主题跟踪的可视化。鉴于此,本文尝试运用共现分析方法及其可视化工具CiteSpace V来绘制主题为“双一流”建设、高校质量监测的知识图谱,并结合社会网络理论进行分析。
(二)研究对象的选取
CiteSpace V来实现共现分析,可分为三种情况,作者共现,关键词共现以及领域共现分析。我们关注于双一流建设或者高校质量监测这个主题的研究热点,所谓研究热点是指在所研究的时期内,有内在联系的、数量相对较多的一系列文献所探讨的科学问题或专题。关键词虽然在文献中所占的比例很小,但却是文献主题的高度凝练和概括,代表了一个领域的知识点和研究热点,在所关注领域中高频率出现的关键词常常被视为热点研究领域。因此,通过分析“双一流”建设或高校质量监测相关文献的关键词,可以在一定程度上反映该领域的技术构成和研究动态。
(三)热点探析的结果
我们接下来做的是关键词共现分析,在共词网络中,我们除了关注关键词出现的频率,同时,也关注每个节点的中心性。一个节点的中心性越高,意味着它控制其他节点间的信息流越多,与其他关键词在文献中共现的次数也就越多,是控制整个网络的“瓶颈性”节点,即关键节点。所以,在一个表征“双一流”建设或高校质量监测领域的共词网络中,中心性强的节点一般代表该领域的关键技术。
在CiteSpace V中,我们把网络节点类型设定为“Keywords(关键词)”,主题词来源选择“标题(Title)、摘要(Abstract)、描述符(Descriptors)和标识符(Identifiers)”,演算路径为最小生成树,其他选项为默认设置。绘制双一流建设或者高校质量监督领域共词图谱,得到共有178个节点,175个连接,网络密度为0.0111。利用CiteSpace V得到关键词共现网络图,如图1所示。图中的每一个节点代表一个关键词,节点大小取决于相应时段内的出现次数。
在图1中可以发现,节点比较大的都是高频关键词,是我们研究的热点之一。但是有些节点比较大,却和其他节点间没有连线,说明中心性比较低。接下来我们具体统计一下关键词频率和共现网络中心性,如下表1和表2。表1中,我们列出频次是7次以上的关键词列表。
由表1所示,一流学科是频次最高的,而“双一流”建设、“双一流”、双一流其实是可以合并为一类,有关双一流的研究频次也很高。再次就是人才培养、高等教育、一流大学建设等。与此相关的研究就是我们关注领域研究的热点和着眼点。
从图1我们可以看出,虽然有些节点比较大,但是与其他节点的连线比较少,我们进一步再从中心性的角度来探寻一下关键词共现网络。我们仅列出中心度高于0.13的关键词。如下表2。 由表2我们可以看出,现代大学制度、高水平大学、学科建设、顶层设计等均具有较高的中心度,这些就是我们关注领域的关键技术。
以上,我们对关注领域的研究热点、关键技术进行了剖析。下面我们探寻下关注领域的研究前沿。
三、研究前沿发现
(一)突变词检索算法查找突变词及突变率
从文献内容来看,研究前沿通常表现为新主题词的大量出现、词间关系变化、主题词含义变迁等。因此,跟踪分析文献集中主题词的变化可以探测研究前沿的诞生。本文所说的研究前沿是指正在兴起或突然涌现的技术主题,代表一个新的动态,强调新趋势和突现(Burst)的特征。
突变词检测算法是Kleinberg于2002年提出的,他提出不仅要关注高频关键词,还要关注那些虽然频次低但变化率高的词,即突变词,因为关键词出现时的密度更加能够体现关键词的重要程度。该算法可以对文献中出现的所有词进行突变分析,及时发现频率低但具有情报意义的词。
CiteSpace V采用“突现词检测”(burst-detection)算法,从大量文献中检测那些频次变化率高的突现词(burst-term)。该算法不仅仅是分析词频的高低,而是依靠词频的变动频次和变动趋势来确定研究前沿,基本原理就是统计文献标题和摘要中词汇的频率,根据这些词汇的增长率来确定研究前沿的热点词汇。在CiteSpace V设置中,Term Type中选择Burst Terms,其他设置如前述不变。
(二)研究前沿探测的结果
突变词检索算法查找到的2015~2017年我们关注领域的突变词及突变率,如下表3所示。
由表3可以看出,突变词是一流大学、学科评估、研究中心,而且頻率及中心性也较高,说明这几个关键词揭示了我们关注的领域的研究前沿。
四、结论
我们借助工具CiteSpace V,应用关键词共现方法探究出来,2015~2017年我国主题为“双一流”建设、高校质量监测的相关研究文献中高频率关键词为,一流学科,“双一流”建设、人才培养等;中心度较高的关键词是现代大学制度、高水平大学、学科建设、顶层设计等。应用突变词检索算法查找突变词及突变率,检索结果表明突变词为一流大学、学科评估、研究中心,这揭示了我们关注领域的研究前沿。
参考文献:
[1]王伟军,王金鹏.科学知识图谱在技术预见中的应用探析[J].情报科学,2010,(08):1127-1131.
[2]赵蓉英,许丽敏.文献计量学发展演进与研究前沿的知识图谱探析[J].中国图书馆学报,2010,(5).
[3]王
旻霞.基于知识图谱的国际知识管理研究可视化分析[J].科技管理研究,2011,(20):175-178.
[4]Kleinberg J.Bursty and Hierarchical Structure in Streams[J].Data Mining
【关键词】 “双一流”建设 高校质量监测研究 共现分析 突变词CiteSpace V近年来,各级政府和各地高校都非常关注两件事情,一是“世界一流大学,世界一流学科”(简称“双一流”)的建设,另一件是高校质量监测。2015年10月24日,国务院印发《统筹推进世界一流大学和一流学科建设总体方案》,要求按照“四个全面”战略布局和党中央、国务院决策部署,坚持以中国特色、世界一流为核心,以立德树人为根本,以支撑创新驱动发展战略、服务经济社会发展为导向,坚持“以一流为目标、以学科为基础、以绩效为杠杆、以改革为动力”的基本原则,加快建成一批世界一流大学和一流学科。双一流建设及与之相关的高校质量监测是我们当前关注的热点和焦点。与之而来的我们很关心近来学者们对此都进行了哪些研究,研究的核心是什么,研究的热点是什么,研究的前沿是什么。而要回答这些问题无疑要借助现代的可视化研究技术。
本文借助现代可视化工具CiteSpace V,运用共现分析和突变词检索算法,结合中国知网数据,对双一流建设、高校质量监测的研究现状进行了剖析,希望能够给研究者在实际研究中提供帮助和参考。
一、研究工具及数据来源
(一)研究工具CiteSpace V简介
CiteSpace V是用来分析和可视共被引网络的Java程序,是一款应用于科学文献中识别并显示科学发展新趋势和新动态的软件。利用CiteSpace V可以寻找某一学科领域的研究进展和当前的研究前沿,及其对应的知识基础。
(二)数据来源
本文所用数據来自中国知网,检索方式是主题词检索,选取的主题词是“双一流”建设或高校质量监测。共搜索到2015-2017年文献496篇,其中2015年2篇,2016年232篇,2017年263篇。下载时对数据进行了预处理和清洗。主要工作包括去除公告、通信信息,删除未标注作者引用以及网络引用,以及根据 CiteSpace V数据格式进行了数据转化。
二、研究热点探析
(一)共现分析的研究方法
共现分析(Co-occurrence analysis)是一种内容分析方法,是将各种信息载体中的共现信息定量化的分析方法,以解释信息的内容联系和特征项所隐含的寓意,被广泛用于知识发现的研究中。它的方法论基础是心理学的临近联系法则和知识结构及映射原则。共同出现的特征项之间一定存在着某种关联,关联程度可用共现频次来测度。利用共现关系绘制某一领域的知识图谱,能够以可视化的方式来探测该领域的研究热点和研究前沿,纵向和横向分析展示相关领域的发展进程、主题结构以及未来发展趋势,反映当前科学研究水平,展示其研究主题的变迁,进而实现预测关注的主题的趋势,实现关注主题跟踪的可视化。鉴于此,本文尝试运用共现分析方法及其可视化工具CiteSpace V来绘制主题为“双一流”建设、高校质量监测的知识图谱,并结合社会网络理论进行分析。
(二)研究对象的选取
CiteSpace V来实现共现分析,可分为三种情况,作者共现,关键词共现以及领域共现分析。我们关注于双一流建设或者高校质量监测这个主题的研究热点,所谓研究热点是指在所研究的时期内,有内在联系的、数量相对较多的一系列文献所探讨的科学问题或专题。关键词虽然在文献中所占的比例很小,但却是文献主题的高度凝练和概括,代表了一个领域的知识点和研究热点,在所关注领域中高频率出现的关键词常常被视为热点研究领域。因此,通过分析“双一流”建设或高校质量监测相关文献的关键词,可以在一定程度上反映该领域的技术构成和研究动态。
(三)热点探析的结果
我们接下来做的是关键词共现分析,在共词网络中,我们除了关注关键词出现的频率,同时,也关注每个节点的中心性。一个节点的中心性越高,意味着它控制其他节点间的信息流越多,与其他关键词在文献中共现的次数也就越多,是控制整个网络的“瓶颈性”节点,即关键节点。所以,在一个表征“双一流”建设或高校质量监测领域的共词网络中,中心性强的节点一般代表该领域的关键技术。
在CiteSpace V中,我们把网络节点类型设定为“Keywords(关键词)”,主题词来源选择“标题(Title)、摘要(Abstract)、描述符(Descriptors)和标识符(Identifiers)”,演算路径为最小生成树,其他选项为默认设置。绘制双一流建设或者高校质量监督领域共词图谱,得到共有178个节点,175个连接,网络密度为0.0111。利用CiteSpace V得到关键词共现网络图,如图1所示。图中的每一个节点代表一个关键词,节点大小取决于相应时段内的出现次数。
在图1中可以发现,节点比较大的都是高频关键词,是我们研究的热点之一。但是有些节点比较大,却和其他节点间没有连线,说明中心性比较低。接下来我们具体统计一下关键词频率和共现网络中心性,如下表1和表2。表1中,我们列出频次是7次以上的关键词列表。
由表1所示,一流学科是频次最高的,而“双一流”建设、“双一流”、双一流其实是可以合并为一类,有关双一流的研究频次也很高。再次就是人才培养、高等教育、一流大学建设等。与此相关的研究就是我们关注领域研究的热点和着眼点。
从图1我们可以看出,虽然有些节点比较大,但是与其他节点的连线比较少,我们进一步再从中心性的角度来探寻一下关键词共现网络。我们仅列出中心度高于0.13的关键词。如下表2。 由表2我们可以看出,现代大学制度、高水平大学、学科建设、顶层设计等均具有较高的中心度,这些就是我们关注领域的关键技术。
以上,我们对关注领域的研究热点、关键技术进行了剖析。下面我们探寻下关注领域的研究前沿。
三、研究前沿发现
(一)突变词检索算法查找突变词及突变率
从文献内容来看,研究前沿通常表现为新主题词的大量出现、词间关系变化、主题词含义变迁等。因此,跟踪分析文献集中主题词的变化可以探测研究前沿的诞生。本文所说的研究前沿是指正在兴起或突然涌现的技术主题,代表一个新的动态,强调新趋势和突现(Burst)的特征。
突变词检测算法是Kleinberg于2002年提出的,他提出不仅要关注高频关键词,还要关注那些虽然频次低但变化率高的词,即突变词,因为关键词出现时的密度更加能够体现关键词的重要程度。该算法可以对文献中出现的所有词进行突变分析,及时发现频率低但具有情报意义的词。
CiteSpace V采用“突现词检测”(burst-detection)算法,从大量文献中检测那些频次变化率高的突现词(burst-term)。该算法不仅仅是分析词频的高低,而是依靠词频的变动频次和变动趋势来确定研究前沿,基本原理就是统计文献标题和摘要中词汇的频率,根据这些词汇的增长率来确定研究前沿的热点词汇。在CiteSpace V设置中,Term Type中选择Burst Terms,其他设置如前述不变。
(二)研究前沿探测的结果
突变词检索算法查找到的2015~2017年我们关注领域的突变词及突变率,如下表3所示。
由表3可以看出,突变词是一流大学、学科评估、研究中心,而且頻率及中心性也较高,说明这几个关键词揭示了我们关注的领域的研究前沿。
四、结论
我们借助工具CiteSpace V,应用关键词共现方法探究出来,2015~2017年我国主题为“双一流”建设、高校质量监测的相关研究文献中高频率关键词为,一流学科,“双一流”建设、人才培养等;中心度较高的关键词是现代大学制度、高水平大学、学科建设、顶层设计等。应用突变词检索算法查找突变词及突变率,检索结果表明突变词为一流大学、学科评估、研究中心,这揭示了我们关注领域的研究前沿。
参考文献:
[1]王伟军,王金鹏.科学知识图谱在技术预见中的应用探析[J].情报科学,2010,(08):1127-1131.
[2]赵蓉英,许丽敏.文献计量学发展演进与研究前沿的知识图谱探析[J].中国图书馆学报,2010,(5).
[3]王
旻霞.基于知识图谱的国际知识管理研究可视化分析[J].科技管理研究,2011,(20):175-178.
[4]Kleinberg J.Bursty and Hierarchical Structure in Streams[J].Data Mining