论文部分内容阅读
在竞争与合作共存的学术生态环境下,本文从新的视角对合著网络中的潜在合作关系作了概念界定和理论探讨,并集中考察和研究了作者-关键词耦合分析法和网络链接预测法在潜在合作关系挖掘中的应用。目前,常用的作者-关键词耦合分析法在潜在合作关系挖掘中存在难以准确地计算作者相似度的缺陷,网络链接预测法则可以从网络结构的角度对作者相似度进行衡量,能在一定程度上弥补作者-关键词耦合分析法的缺陷。因此,本文作者尝试将作者-关键词耦合分析法与网络链接预测法两种方法相结合,从研究主题和网络结构二维角度研究作者的潜在合作关系,以更加有效、准确地预测作者之间的合作概率。 首先,本文对研究中涉及的理论基础和该领域国内外的研究现状进行了系统梳理和深入分析。对潜在合作关系、复杂网络、链接预测、作者-关键词耦合等方法技术的概念和相关理论进行了论述分析。通过对国内外研究现状的调研发现,现有的研究方法主要有以引文理论为基础的作者同被引分析法、文献耦合分析法;以共现理论为基础的作者-关键词耦合分析法、共现分析法以及引文分析法与共现分析法的结合;以网络结构为基础的基于节点属性相似性、节点结构相似性、路径相似性的链接预测法。通过对以上研究方法的对比分析,发现作者-关键词耦合分析法存在的缺陷,提出用TF-IDF改进作者-关键词耦合分析法的构想。 其次,在文献调研的基础上,设计和构建了作者潜在合作关系挖掘的模型框架:包括总体方法流程、数据准备模块、作者影响力评价模块、潜在合作关系挖掘模块和评价模块,其中作者影响力评价模块和潜在合作关系挖掘模块是整个方法流程的核心和创新点。在作者影响力模块中重新构建了作者影响力的测度指标,并采用基于熵权的灰色关联分析法评价作者的影响力,避免了人为因素的干扰,保证了评价过程的客观性和全面性。在构建潜在合作关系挖掘模块时,采用TF-IDF的赋权方式改进作者-关键词耦合分析法,并将改进后的作者-关键词耦合分析法与链接预测法相结合,采用Binary Logistic回归模型预测作者之间的合作概率。通过两种方法的有机结合,弥补了现有方法的缺陷,提升了合作概率计算的准确率和实用性。 最后,作者以合成生物学领域为对象,用本文设计的研究方法进行了实证研究。重新评价了该领域核心作者的影响力,揭示了该领域存在的潜在合作关系。通过实例验证,在一定程度上证实了方法设计的合理性和有效性。