论文部分内容阅读
引文网络是由引用文献和被引文献以及它们之间的引用关系共同组成的一种网络。引文网络是一个知识的网络,通过引文网络我们可以了解知识的产生和传播过程。然而,引文网络在给人们提供了大量知识的同时,也使人们掉进了知识的沼泽而使人更加困惑。特别是当人们输入一个关键词查找文献时,通常会查找出大量的相关文献使人们很难快速而准确的获得想要的文献。因此,若能够使原有的引文网络具有语义表示能力,这将为引文网络的查询检索和研究提供一种更高效率的方法。引文网络缺乏语义而且不能进行推理,但是对引文网络的语义表示和语义推理的研究却不多。为了使引文网络可以表达语义信息和具有推理能力,本文首先把语义链网络和引文网络相结合,提出了引文语义链网络的模型,使原有的引文网络不但具有语义表示能力而且具有推理能力。我们可以根据引文语义链推理规则获得网络中隐含的引文语义链和引文之间新的语义关系。另一方面,随着知识的迅速增加,引文网络已经变成了一个大规模的复杂网络。在引文网络中每个文献对于知识的流动都起到不同的作用,有一些文献处于核心地位对知识的流动起到了重要的枢纽作用,而另一些文献的影响作用则很小。为了找到引文网络中不同研究领域的语义社区和语义社区中的重要文献,本文提出了引文语义链网络的社区发现算法。通过该算法我们可以找到引文网络中不同研究领域的语义社区,这对于了解某种知识处于知识体系中的什么位置以及在知识流动的过程中起到了什么样的作用,对于了解某种知识的整个脉络,预测未来的发展方向和热点问题都具有十分重要的意义。本文正是基于上述的背景,通过结合语义Web、语义链网络、引文网络和复杂网络的理论,对引文网络中的社区发现进行了相关研究。本文的主要研究工作和创新点表现在以下几个方面:(1)提出了引文语义链网络的模型,用于引文之间语义关系的表示和推理。为了使引文网络可以表达语义信息和具有推理能力以便充分高效获取引文信息,我们把语义链网络和引文网络相结合,提出了引文语义链网络的模型,使原有的引文网络不但能够具有语义而且具有推理能力,还可以根据引文语义链推理规则获得网络中隐含的引文语义链和引文之间新的语义关系。该引文语义链网络的模型,为引文网络的查询检索和复杂网络的研究提供了一种高效率的方法。(2)提出了基于引文相似度计算的引文语义链网络的社区发现算法,用于发现引文语义链网络中的语义社区。本文首先给出了引文之间的语义相似度计算,然后根据基于引文相似度计算的引文语义链网络社区发现算法可以找出引文语义链网络的语义社区以及相关研究领域的重要文献。这对揭示科学的动态结构,了解各领域的前沿问题,并预测未来的发展方向和热点问题都具有重要的意义。(3)采用了Matlab构建了实验系统,仿真了引文语义链网络的社区发现的过程,统计分析了各项实验数据,验证了本文提出的引文语义链网络模型和引文语义链网络社区发现算法的可行性和有效性。