基于引文网络关联属性的知识扩散路径研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zbtoy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技创新是国家创新体系的关键组成部分,而基础研究领域的创新是科技创新的源头和基础。科学文献是基础研究领域知识创新成果的主要载体,在科学文献撰写过程中会以引文的形式标记用到的已有文献,体现知识之间的内在联系。基于引文的知识扩散记录了基于引用行为的知识传承。随着知识量的迅速增长,引文网络已经形成了一个超大规模的网络系统,网络中每个节点的生成包含了知识的创新与转化,而每条边的生成则代表了知识的获取、传播与扩散,通过引文网络对知识扩散进行深入研究可以更深刻认识知识扩散的本质与规律。但是,知识扩散的复杂性使得扩散的过程和路径难以被清晰地认识,其背后所蕴含的知识扩散规律无法被准确地描述,知识的抽象性也使得知识扩散水平难以被定量测度。  主路径分析方法可以从交错庞杂的引文网络中提取学科领域发展的骨干网络,展示学科发展历史和知识扩散路径,帮助人们理解和把握知识扩散规律。经典主路径分析方法已被广泛用于论文引文网络和专利引文网络,以识别学科领域知识扩散路径和技术领域创新演化路径。鉴于经典主路径方法的局限性,后来学者对其进行了多方面的拓展研究。通过总结已有的研究工作发现,主路径方法研究还存在三点不足,即主路径的弧权值、遍历权重和主路径选择原则。论文选择前两点不足作为研究问题,以SPC(Search Path Count)遍历权重作为修正和比较的基础。  经典主路径方法源于图论中边的遍历权重计算和路径搜寻方法,在应用于引文网络知识扩散主路径识别的时候,没有考虑网络中节点和边所代表的知识和知识传播的实际意义,没有考虑节点基于文献属性的相关性,没有区分节点和边的差异性。论文引文网络以文献作为基本单元,文献本身具有多种属性,如作者、机构、学科、期刊等,施引文献和被引文献基于这些属性可能具有一定的关联。论文研究的出发点是在保留经典主路径方法遍历权重的基础上,加上引文网络节点基于文献属性的相关性。论文提出了基于引文网络关联属性的知识扩散路径研究框架,围绕该框架,论文开展了引文节点对基于关联属性的相关性的表示和量化方法研究、基于SPC遍历权值的综合加权的构建方法研究、基于引文网络关联属性的知识扩散路径识别方法研究以及对学科领域内和科研单元内的知识扩散路径识别的实证研究。  首先,论文分析了异质信息网络和带有关联属性的引文网络的本质和特征,提出借用异质信息网络的理论和方法来帮助开展本文研究。论文使用元路径来表示和量化引文节点基于关联属性的相关性,选择PathSim算法实现基于元路径的节点相关性度量。其次,论文对SPC遍历权值和关联属性权值进行了线性组合。为保证两种权值的量纲统一,考察所选研究领域引文网络的结构特征,选用对数标准化方法对SPC遍历次数进行标准化,经过多次摸索试验确定两种权值的组合比例系数为0.7和0.3,以保证在发挥SPC主导作用的时候,也能发挥关联属性的特征作用。最后,论文选择学科领域内和科研单元内的知识扩散路径识别进行实证研究,从两个应用场景、四个角度对知识扩散路径的特征和作用开展对比分析,以验证所提出方法的有效性和适用性。  在学科领域内的知识扩散路径研究中,分别选取作者、机构、主题三种关联属性构建加权引文网络识别知识扩散路径,并将其与使用经典主路径方法识别的知识扩散路径相比较。结果显示:①二者特征不同。经典主路径方法中,使用前向搜寻或后向搜寻时,搜寻起点端具有多条“起始路径”,呈现明显的“扇形状”;而加权主路径搜寻起点端的“多发散状”特性消失,主路径长度较短。②二者作用不同。加权主路径上关联属性特征明显,比经典主路径方法能更深刻揭示其知识扩散关系,即基于作者属性的主路径可以呈现作者合作特征及不同作者在知识扩散中承担的角色,可揭示不同合作团体在知识扩散中的时间分布和主题差异,直观呈现合作和引用的关联性;基于机构属性的主路径直观地呈现重要研究机构合作特征及不同机构在知识扩散中发挥的作用,揭示不同机构在具体学科领域的优势和贡献;基于作者发文属性的主路径可以反映文献主题之间的相关性及知识扩散内容的变化性,反映合作和引用相关性与研究主题相似性的一致性,揭示知识扩散领域和扩散对象的变化性。  在科研单元内的知识扩散路径研究中,论文聚焦于作者属性,使用作者属性构建加权引文网络识别知识扩散路径。论文以量子信息领域的四个顶尖机构(简称量子四机构)为实证对象,将其经典知识扩散路径和基于关联属性的知识扩散路径的特征和作用相比较。结果显示:①二者特征不同。不同于经典知识扩散路径,基于关联属性的知识扩散路径前向和后向局部主路径呈现不同程度的相似度,多主路径结构复杂,新增节点均形成了脉络清晰、开放的子路径。②二者作用不同。经典知识扩散路径可反映科研单元的知识扩散特点和知识扩散领域,基于关联属性的知识扩散路径不仅能反映一致的知识扩散特点和扩散领域,还可比较不同科研单元的合作范式和发展模式特征,反映科研单元内部核心研究者的科研履历变化。  最后,论文将两类知识扩散路径在不同场景中进行了横向对比,结果显示:基于关联属性的知识扩散路径比经典知识扩散路径具有更有效的识别效果和应用前景。  论文的创新贡献包括:①提出了一个基于引文网络关联属性的知识扩散路径研究框架与方法。该框架步骤清晰,操作性强,具有较广泛的适用性,是对经典主路径知识扩散研究方法的改进,能揭示经典主路径分析方法不能揭示的知识扩散的相关属性,可更真实客观地反映知识扩散的过程。②使用异质信息网络中的元路径方法描述和量化引文节点对基于关联属性的相关度。实证结果表明,元路径方法可以挖掘引文节点对基于关联属性的隐形关系,使具有属性关联关系的引文节点对位置集中地出现在知识扩散路径上,从而揭示知识扩散过程中更多属性相关的细节。③提出了一种基于引文网络关联属性的遍历权值的加权方法。论文以SPC遍历权值为修正和比较的基础,将引文节点对基于关联属性的相关度与标准化的SPC遍历权值进行线性组合形成新的遍历权值,用其来识别基于关联属性的知识扩散路径。  本论文的研究不仅在方法上对主路径分析方法在知识扩散路径识别中的应用进行了有益拓展,为后续深入展开基于引文网络关联属性的知识扩散路径研究提供了方法和实践基础,而且还对利用异质信息网络和引文网络相结合开展相关研究提供方法参考。在未来的研究中,将继续深入挖掘引文节点对基于多属性的关联,尝试多维知识扩散路径的描绘,以更深入更细致地揭示知识扩散的客观路径与本质。
其他文献
晋商是明清时期国内重要商帮之一,称雄商界五百年,在山西历史乃至整个中国历史舞台上扮演着不可小窥的角色。其留给世人的珍贵的档案资料具有相当的研究价值,不仅可以追溯、考究
机构知识仓储已经逐步发展成为大学和科研机构实现知识资产的统一管理和长期保存目标的重要应用和服务模式,在国外得到了普遍的重视和较快的发展。本论文旨在通过对国内外机构
科技发展和文化繁荣带来了庞大的社会信息需求,为此图书馆需要不断强化其文化传播、社会教育和信息服务等功能。采用自助式借还书系统由于在有效提高图书流通速度的同时,还能
摘 要:随着建筑市场竞争的日益激烈,工程项目资金预算管理的重要性越来越重要,直接影响到施工单位的生存和发展。本文的第一部分,结合实际分析项目建设管理中存在的问题,然后再根据问题提出解决方案,以进一步明确项目资金预算在施工管理中的应用,制定相应的对策。本文论述了项目资本预算管理在工程建设管理中的应用。  关键词:项目资金预算管理;工程建设管理;应用  中图分类号:F284 文献标识码:A 文章编号:
清未民初是中国历史上金石学兴盛活跃的时期,诞生了大批金石学家,并有多部著作相继问世。在众多著作等身的金石学者当中,郭玉堂是卓有成就的一位。他亲访碑拓,搜集了大量的珍贵碑
随着人们带薪假期的增加和旅游者素养的提高,旅游成为当前的社会热点。在旅游活动开展过程中,旅游档案数量越来越多,作用越来越大。旅游档案是开发旅游资源的依据,是进行文物古迹
2000年,Ariba、IBM、Microsoft和其他33家公司在共同创立了统一描述、发现和集成协议(UDDI)。通过全球合作者的努力,UDDI被认可为一项合适的商务信息发布与发现的机制,并很快被O
中国当前正处在社会转型期的阶段,社会结构和社会政策都出现了一些新的特点,对档案的利用产生了相应的影响,进而对档案利用政策的制定和实施也提出了新的要求,与此同时,中国当前档
随着DOI在Internet上逐步地普及与发展,未来的DOI将会成为一个国际标准。在科技期刊服务发展中积极地推进中国科技论文资源的DOI系统的研究、应用和开发意义重大。一方面为我
“以用户为中心”一直是信息构建的核心理念和指导原则之一.传统信息构建的用户中心理念注重信息可被理解,强调对信息结构的图形展示.在Web2.0环境下,随着“用户产生内容”模