论文部分内容阅读
科技创新是国家创新体系的关键组成部分,而基础研究领域的创新是科技创新的源头和基础。科学文献是基础研究领域知识创新成果的主要载体,在科学文献撰写过程中会以引文的形式标记用到的已有文献,体现知识之间的内在联系。基于引文的知识扩散记录了基于引用行为的知识传承。随着知识量的迅速增长,引文网络已经形成了一个超大规模的网络系统,网络中每个节点的生成包含了知识的创新与转化,而每条边的生成则代表了知识的获取、传播与扩散,通过引文网络对知识扩散进行深入研究可以更深刻认识知识扩散的本质与规律。但是,知识扩散的复杂性使得扩散的过程和路径难以被清晰地认识,其背后所蕴含的知识扩散规律无法被准确地描述,知识的抽象性也使得知识扩散水平难以被定量测度。 主路径分析方法可以从交错庞杂的引文网络中提取学科领域发展的骨干网络,展示学科发展历史和知识扩散路径,帮助人们理解和把握知识扩散规律。经典主路径分析方法已被广泛用于论文引文网络和专利引文网络,以识别学科领域知识扩散路径和技术领域创新演化路径。鉴于经典主路径方法的局限性,后来学者对其进行了多方面的拓展研究。通过总结已有的研究工作发现,主路径方法研究还存在三点不足,即主路径的弧权值、遍历权重和主路径选择原则。论文选择前两点不足作为研究问题,以SPC(Search Path Count)遍历权重作为修正和比较的基础。 经典主路径方法源于图论中边的遍历权重计算和路径搜寻方法,在应用于引文网络知识扩散主路径识别的时候,没有考虑网络中节点和边所代表的知识和知识传播的实际意义,没有考虑节点基于文献属性的相关性,没有区分节点和边的差异性。论文引文网络以文献作为基本单元,文献本身具有多种属性,如作者、机构、学科、期刊等,施引文献和被引文献基于这些属性可能具有一定的关联。论文研究的出发点是在保留经典主路径方法遍历权重的基础上,加上引文网络节点基于文献属性的相关性。论文提出了基于引文网络关联属性的知识扩散路径研究框架,围绕该框架,论文开展了引文节点对基于关联属性的相关性的表示和量化方法研究、基于SPC遍历权值的综合加权的构建方法研究、基于引文网络关联属性的知识扩散路径识别方法研究以及对学科领域内和科研单元内的知识扩散路径识别的实证研究。 首先,论文分析了异质信息网络和带有关联属性的引文网络的本质和特征,提出借用异质信息网络的理论和方法来帮助开展本文研究。论文使用元路径来表示和量化引文节点基于关联属性的相关性,选择PathSim算法实现基于元路径的节点相关性度量。其次,论文对SPC遍历权值和关联属性权值进行了线性组合。为保证两种权值的量纲统一,考察所选研究领域引文网络的结构特征,选用对数标准化方法对SPC遍历次数进行标准化,经过多次摸索试验确定两种权值的组合比例系数为0.7和0.3,以保证在发挥SPC主导作用的时候,也能发挥关联属性的特征作用。最后,论文选择学科领域内和科研单元内的知识扩散路径识别进行实证研究,从两个应用场景、四个角度对知识扩散路径的特征和作用开展对比分析,以验证所提出方法的有效性和适用性。 在学科领域内的知识扩散路径研究中,分别选取作者、机构、主题三种关联属性构建加权引文网络识别知识扩散路径,并将其与使用经典主路径方法识别的知识扩散路径相比较。结果显示:①二者特征不同。经典主路径方法中,使用前向搜寻或后向搜寻时,搜寻起点端具有多条“起始路径”,呈现明显的“扇形状”;而加权主路径搜寻起点端的“多发散状”特性消失,主路径长度较短。②二者作用不同。加权主路径上关联属性特征明显,比经典主路径方法能更深刻揭示其知识扩散关系,即基于作者属性的主路径可以呈现作者合作特征及不同作者在知识扩散中承担的角色,可揭示不同合作团体在知识扩散中的时间分布和主题差异,直观呈现合作和引用的关联性;基于机构属性的主路径直观地呈现重要研究机构合作特征及不同机构在知识扩散中发挥的作用,揭示不同机构在具体学科领域的优势和贡献;基于作者发文属性的主路径可以反映文献主题之间的相关性及知识扩散内容的变化性,反映合作和引用相关性与研究主题相似性的一致性,揭示知识扩散领域和扩散对象的变化性。 在科研单元内的知识扩散路径研究中,论文聚焦于作者属性,使用作者属性构建加权引文网络识别知识扩散路径。论文以量子信息领域的四个顶尖机构(简称量子四机构)为实证对象,将其经典知识扩散路径和基于关联属性的知识扩散路径的特征和作用相比较。结果显示:①二者特征不同。不同于经典知识扩散路径,基于关联属性的知识扩散路径前向和后向局部主路径呈现不同程度的相似度,多主路径结构复杂,新增节点均形成了脉络清晰、开放的子路径。②二者作用不同。经典知识扩散路径可反映科研单元的知识扩散特点和知识扩散领域,基于关联属性的知识扩散路径不仅能反映一致的知识扩散特点和扩散领域,还可比较不同科研单元的合作范式和发展模式特征,反映科研单元内部核心研究者的科研履历变化。 最后,论文将两类知识扩散路径在不同场景中进行了横向对比,结果显示:基于关联属性的知识扩散路径比经典知识扩散路径具有更有效的识别效果和应用前景。 论文的创新贡献包括:①提出了一个基于引文网络关联属性的知识扩散路径研究框架与方法。该框架步骤清晰,操作性强,具有较广泛的适用性,是对经典主路径知识扩散研究方法的改进,能揭示经典主路径分析方法不能揭示的知识扩散的相关属性,可更真实客观地反映知识扩散的过程。②使用异质信息网络中的元路径方法描述和量化引文节点对基于关联属性的相关度。实证结果表明,元路径方法可以挖掘引文节点对基于关联属性的隐形关系,使具有属性关联关系的引文节点对位置集中地出现在知识扩散路径上,从而揭示知识扩散过程中更多属性相关的细节。③提出了一种基于引文网络关联属性的遍历权值的加权方法。论文以SPC遍历权值为修正和比较的基础,将引文节点对基于关联属性的相关度与标准化的SPC遍历权值进行线性组合形成新的遍历权值,用其来识别基于关联属性的知识扩散路径。 本论文的研究不仅在方法上对主路径分析方法在知识扩散路径识别中的应用进行了有益拓展,为后续深入展开基于引文网络关联属性的知识扩散路径研究提供了方法和实践基础,而且还对利用异质信息网络和引文网络相结合开展相关研究提供方法参考。在未来的研究中,将继续深入挖掘引文节点对基于多属性的关联,尝试多维知识扩散路径的描绘,以更深入更细致地揭示知识扩散的客观路径与本质。