国内关联数据研究进展

来源 :知识管理论坛 | 被引量 : 0次 | 上传用户：wskiqpk

【摘要】

：

【作者】

：

孙雨生余晓琳仇蓉蓉

【出处】

：

知识管理论坛

【发表日期】

：

2013年2期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　【摘要】以CNKI为数据源，从发文基本状况、作者统计、引文分析三方面对2008-2012年国内58篇关联数据研究论文进行文献计量分析，旨在揭示近5年国内关联数据的研究状况，为相关研究提供参考。
　　【关键词】关联数据文献计量分析 CNKI
　　引言
　　关联数据是顺应Web技术从文档网络过渡到数据网络趋势而产生、用来发布和联接各类数据的规范[1-2]，旨在构建计算机可理解的语义数据网络，而非只有人才能读懂的文档网络，故关联数据可看作是语义万维网的简化实现[1，3]，具有重要的研究意义。
　　本文通过对国内关联数据研究论文进行文献计量分析，揭示国内关联数据研究状况，为相关研究提供参考。具体以Excel为统计工具，同时辅以EndNote，以CNKI为数据源，以“关联数据”为关键词，在题名中进行检索，检索时间段为2008-2012年，截至2012年9月10日，共检索到82篇文献，剔除相关度不高的文献，实际有效文献为58篇。
　　发文基本状况分析
　　2.1 发文地区分布分析
　　考察关联数据研究的地区分布有利于了解国内研究关联数据的活跃区，并为地域性合作研究提供依据。笔者统计了54篇文献（其余4篇不含地区字段）第一作者所在地域（见表1）。可以看出，国内关联数据研究的地区分布较集中，北京和上海两地发文合计20篇，占总量的34.48%，说明两地高度重视“关联数据”研究并在该领域具有较强实力；北京地区以13篇发文量名列第一，究其原因，在政治、经济和文化方面，北京的中心地位不可忽略；在学术氛围方面，北京有一大批学术实力雄厚的高校、研究机构[4]。上海以7篇发文量位居第二，其中，以上海图书馆为代表的一批研究机构和以刘炜为代表的一批科研人员起着极其重要的作用。此外，沿海等经济发达地区对关联数据的研究相较于中西部地区显得更加活跃，印证了经济在科研方面的现实影响力。
　　2.2 发文机构分布分析
　　机构分布可大致描绘国内关联数据的研究力量分布，为相关研究机构合作、交流提供依据。笔者通过分析54篇文献（其余4篇无作者）的第一作者的第一单位，发现有39家研究机构发表了关联数据相关论文，发文量在2篇及以上的机构有6家，占总量的15.38%，详见表2。其中，中国科学院国家科学图书馆发文量为7篇，中国科学技术信息研究所发文量为4篇，可见，关联数据研究已引起国内一些科研机构的重视。各类机构发文量统计结果见表3，发文百分比分布见图1。可见，以中国科学院国家科学图书馆为代表的图书馆及高校科研机构在关联数据研究方面实力较雄厚，成为推动该领域发展的主导力量和主要研究机构，并为该领域研究奠定了坚实基础。
　　2.3 发文基金论文比分析
　　由于重大基金项目的负责人通常具有较高学术造诣，项目团队成员具有较强科研能力，且项目本身有较强团队性，研究时间和经费相对有保证，因此，基金论文比可反映国内关联数据研究的学术水平、受资助与受关注情况[4-5]，具体见表4。由表4可看出，受国家基金资助的有15篇，受其他基金资助的有12篇，国家基金论文所占百分比为25.86%，基金论文所占百分比为46.55%。可见，2008-2012年，国家基金论文数所占比例均较高，说明国家高度重视关联数据研究。
　　2.4 发文年度分布分析
　　发文年度分布可在一定程度上反映具体研究领域的研究状况、研究水平、发展速度及发展阶段。2008-2012年，国内关联数据相关文献共58篇，年均发文量为11.6篇，发文年度分布趋势见图2，年度分布见表5。Gompertz生长曲线模型将文献增长分为萌芽（文献增长较慢）、发展（文献急剧增长）、成熟（文献增长速度趋缓）、饱和（文献增长速度为 0）4个阶段[6]。根据此模型，结合表5和图2，笔者将国内关联数据至今的发展历程分为两个阶段：2008-2009年为萌芽阶段，发文数量占论文总量的6.9%；2010-2012年为发展阶段，发文数量占论文总量的93.1%，论文增长速度较快，研究者从不同角度展开研究，应用领域不断扩展，学科交叉性增强。
　　2.5 发文期刊分布分析
　　发文期刊分布分析旨在了解期刊特点，确定研究领域的核心期刊，为引导读者阅读、搜集及管理文献提供依据[7]。根据统计，54篇期刊论文（除4篇学位论文）共刊载在22种刊物上（见表6），其中载文量最多的是《现代图书情报技术》（11篇，占总期刊论文的20.37%）。载文量排名前8的期刊合计载文量占期刊论文总量的74.07%；发文期刊集中在图书情报领域；《农业网络信息》等农业科学类期刊也开始涉及关联数据研究，说明关联数据研究领域正在扩展。
　　布拉德福定律将刊载某研究领域论文的期刊分为核心区、相关区、离散区，当各区论文数大致相等时，核心区、相关区、离散区期刊数近似成1：n：n2关系[8-9]。笔者根据表6将期刊按载文量分成核心区（载文量为7篇以上）、相关区（载文量在3-6篇之间）、离散区（载文量为2篇及以下）3个区域（见表7）。3个区域期刊数之比为2：4：16，约简为1：2：8，可近似为1：3：9，即布拉福德离散系数为3。3个区的平均载文密度分别为9.0、4.5、1.1，故该领域期刊核心效应非常明显。
　　2.6 发文关键词词频分析
　　通过关键词词频分析可快速了解具体领域的研究热点，笔者用EndNote统计共得124个关键词（关键词总频次为216），出现频次在两次及以上的关键词见表8，其中，“关联数据”、“语义网”、“图书馆”、“RDF”、“数据网络”、“D2R”、“元数据”出现频次较高，占总量的41.67%，可见，这些关键词是国内关联数据领域的研究热点。
　　作者统计
　　3.1 高产作者分析
　　作者发文量可揭示作者对具体领域研究的持续性、深度及贡献大小[10]，通过统计（仅针对第一作者），笔者发现54篇文献（其余4篇无作者）共涉及90位作者，高产作者见表9。核心作者是活跃在具体研究领域的专业人员，其凭借独到视角及新颖观点而极具代表性。根据普赖斯定律，核心作者群的发文量应占文献总量的50%，核心作者最低发文量m≌0.749* （是发文最多作者的发文量）[10]。根据表9，可得核心作者的发文量应为2篇及以上（具体涉及7位作者），核心作者累计发文18篇，占论文总量的33.33%，与普赖斯提出的50%相差较远，说明国内关联数据研究领域“作者较多，核心作者少，发文量低”，尚未形成稳定的核心作者群。　　3.2 合著统计分析
　　高质量学术论文的高标准要求决定了当今作者的合作之路[4]。2008-2012年国内关联数据研究论文合著状况见表10，国内关联数据研究基本保持稳定的高度合作，合著率在50%以上，平均合著率为53.45%，其中2人合作最普遍，占论文总量的29.63%，可见关联数据研究具有高难度性、内外交叉渗透性、学术前沿性和广泛应用性。
　　4.1 引用分析
　　2008-2012年国内关联数据引文状况见表11，篇均引用量为19.1。从中外文引用文献比来看，近5年中文引用率较低，平均中外引用文献比为0.45：1，表明国外关联数据发展更快，国内科研人员利用和吸收外文文献能力较强，2012年时该值达到0.87：1，表明近年来国内关联数据研究发展迅速，科研队伍不断壮大，论文数量增长较快。但国内关联数据研究要想在国际上占据一席之地，除研究吸收国外研究成果之外，还必须有自己的独到之处。
　　4.2 被引分析
　　论文被引用状况在某种程度上可衡量论文价值，国内关联数据研究论文被引状况见表12，共30篇论文被引用，被引次数为154次，平均被引频次为5.1。其中被引频次最高的是黄永文的《关联数据在图书馆中的应用研究综述》，共被引19次。表13列出了被引次数超过6次的论文（共10篇论文，被引频次共106次，占被引总量的68.83%，其中4篇刊载在核心期刊上），可见，国内关联数据文献被引频次较高，具有较高的学术影响力，高被引文献较集中，存在学者公认的较权威文献。
　　结束语
　　顺应大数据和语义Web发展趋势，国内关联数据研究正处于快速发展阶段，已引起一些研究机构及科研人员的重视，其研究区域正逐布扩大，国家支持力度越来越大，且发文质量较高。但目前国内关联数据相关研究较少，且这些论文大多处于理论探索阶段，缺乏足够的实践支持；虽然研究关联数据的核心作者群已见雏形，但尚未完全形成。因此，国内关联数据研究必须加大力度，立足实践，不断注入新的研究力量，形成以核心作者群为主导力量的研究团队。
　　[参考文献]
　　[1] 刘炜.关联数据：概念、技术及应用展望[J].大学图书馆学报，2011（2）：5-12.
　　[2] 朝乐门，张勇，刑晓春.DBpedia及其典型应用[J].现代图书情报技术，2011（3）：80-87.
　　[3] 谭洁清.关联数据的简介与进展[J].信息与电脑（理论版），2011（1）：103-103，106.
　　[4] 刘玉梅，王正兴.“十一五”期间《中国图书馆学报》文献计量分析[J].情报科学，2012，30（1）：81-86.
　　[5] 刘圣君，屈宝强.我国图书馆联盟研究的文献计量分析[J].情报科学，2011，29（3）：396-400，468.
　　[6] 陆晓红.基于 Web of Science 的知识研究文献计量分析[J].情报科学，2009，27（12）：1848-1852.
　　[7] 何琳，喻文.我国社区图书馆研究论文计量分析[J].图书馆学刊，2007（1）：80-83.
　　[8] 胡承立，张韦.基于CSSCI的中国政府网站研究现状文献计量分析[J].现代情报，2011，31（12）：159-165.
　　[9] 陈氢，陈梅花.信息检索与利用[M].北京：清华大学出版社，2012.
　　[10] 樊长军，李小青.近10年我国社区图书馆研究文献计量分析[J].图书馆学刊，2011（9）：130-133.

其他文献

基于系统设计的微博检索系统评价研究

［摘要］在以往检索系统评价指标的基础上，提出适合于评价检索系统的指标集，具体为检索界面、检索框、分类检索、热门列表、检索选项、检索提示、页面描述和快照功能8项指标。在这一指标集的基础上，利用网络调查法和比较法对新浪微博搜索和百度搜索进行比较研究。研究结果显示，新浪微博搜索的检索系统虽使用大部分指标，但与百度搜索相比存在程度不深、力度不足等问题。最后提出新浪微博搜索可从优化分类检索功能、实现智能化

期刊

信息不对称情况下的农产品市场

[摘要] 农产品市场供求信息不对称、市场波动性大、产品流通不畅等,已成为制约我国农产品市场发育的重要因素。其中农产品市场供求信息不对称是导致农产品市场波动性大并进而影响到农产品市场交易规模的重要原因之一。运用信息经济信息不对称理论的框架,从供给与需求两个角度研究农产品信息不对称对农产品市场的影响,并给出减少农产品市场信息不对称的政策含义。　　[关键词] 柠檬市场信息不对称农产品　　传统经济

期刊

文献传递服务的著作权合理使用管理策略与框架研究

【摘要】　　梳理图书馆开展文献传递服务中著作权管理相关问题。认为图书馆面临的著作权问题可以分为三个方面：立法建议、用户管理和图书馆员管理。分析国外若干图书馆开展非返还型文献传递服务的著作权管理策略，归纳用户分类管理、读者权益管理、文献传递系统应用和文献传递服务管理等措施，最后总结图书馆实施著作权管理的框架。　　【关键词】　　文献传递服务合理使用管理著作权管理框架　　在图书馆服务和建设中，著作权

期刊

电子政务语义互操作发展现状研究

[摘要]首先分析欧盟互操作框架(EIF),总结4种类型互操作使用的情况。在此基础上,重点分析各国实施的语义互操作项目,总结出3种实现语义互操作的方法,分别是:将SOA、语义和本体论结合,WSMO中Choreography、Orchestration和中介器以及服务?—需求转换器。　　[关键词]语义互操作 SOA WSMO 中间件服务需求转换器　　1 引言　　电子政务的建设最重要的就

期刊

影视作品中的图书馆隐含元素及其未来发展的思考

［摘要］图书馆在影视作品中呈现的元素不再限于建筑风格、藏书格局和人物形象，而传递着更多跟随时代发展的隐含元素，包括图书馆宝藏对合作存储的必要性的体现，信息考据情节对图书情报档案一体化的预示，现代化的侦探手法与泛在图书馆的异曲同工，记忆忆粒的科学幻想对数字存储的启示，学者精神对学科馆员队伍建设的激励以及歌舞表演对图书馆娱乐精神的表达，都透露出人们对传统图书馆的认识及其未来可能发展的方向。　　［关键

期刊

基于社会网络的战略信息系统及其竞争情报应用

［摘要］以社会网络中节点之间的关系为基础，从社会网络、战略信息系统和企业竞争优势三个角度进行分析，并以此为框架构建基于社会网络的企业内外部战略信息系统。从低成本战略、差异化战略和专一化战略三个方面探讨基于社会网络的战略信息系统对企业竞争优势的影响，并提出将其应用于竞争情报工作的思路。最后指出，基于社会网络的战略信息系统从内外两个层次为企业提供丰富的情报信息，为企业战略决策制定和竞争优势保持提供保证

期刊

大学网络用户信息行为研究

［摘要］利用cnzz统计软件，通过对兰州大学图书馆网站用户访问报表的分析,利用spss统计软件对用户访问行为进行统计分析与研究，挖掘出用户访问的深层行为及规律，为优化教育和科研机构的网络信息服务提供依据和帮助。　　［关键词］网络用户行为分析信息行为图书馆　　1 研究背景及意义　　网络行为学的诞生源于网络的普及和发展对社会、经济发展所造成的深刻影响。国内研究学者邓小昭[1]对网络用户信

期刊

美国TOP 20高校图书情报专业研究热点及其变化情况

［摘要］以2012年US News＆World Reports公布的美国大学图书情报专业TOP 20学校为依据，以SSCI收录文章为数据源，借助Bibexcel提取关键词构建相异矩阵，利用SPSS聚类分析，采用“Squared Euclidean Distance”方法，对2001-2005和2006-2011的树状图分析两个时间段研究热点的共性和差异性。目的在于了解美国TOP 20高校图书情报

期刊

我国学科馆员研究工作的嬗变与发展

[摘要]以CNKI中国知网的《中国引文数据库》和维普《中文科技期刊数据库》（引文版）为数据统计源，对1987—2011年我国有关学科馆员论文被引情况按年代、引文总量、论文累积数、引用频次、期刊来源、期刊的离散、期刊引用频次、期刊的秩和比法、作者合作度与作者机构等11个指标进行文献计量分析，梳理我国学科馆员研究工作从溯源到现在发展的概况，以期较为客观地反映研究的现状，揭示其发展趋势，为今后我国学科馆

期刊

基于Solr的机构知识库检索系统构建研究

[摘要]介绍Solr的概念、特性以及体系结构，并使用它设计和构建机构知识库的检索系统，该系统初步具备简单检索、高级检索、分面检索、相似资源检索、访问统计等功能，，实现了机构知识库的个性化检索。　　[关键词] Solr 机构知识库检索系统　　1 引言　　伴随着计算机技术、网络技术以及数字化技术的迅速发展，数字化资源的发布和共享不再受时间、空间的限制。在研究机构和大学里，由研究人员和教师通

期刊

国内关联数据研究进展

与本文相关的学术论文