论文部分内容阅读
最近几年,复杂网络在科学研究中变得越来越活跃。随着人们对复杂网络的性质的深入研究,人们逐渐发现了复杂网络中存在的一些共同性质,比如无标度特性、社区结构等。复杂网络中的社区结构可以看作是现实世界中关系的一种映射,比如在学术合作的网络中,研究共同课题或比较类似课题的人员也会组成一个团体。在学术论文关键字网络中,联系比较紧密的技术或方法会组成一个技术社区。这时,如何快速有效的在大型复杂网络中找到较好的社区结构就成为了研究者比较关注的问题。社区发现研究就是在这种背景下产生的。本课题致力于从大量科研文章中提出关键字,并对提出的关键字进行过滤,进而构建大型关键字复杂网络,然后使用技术关联性分析方法,对技术进行分层的社区划分,构成层次化技术社区体系,挖掘出该技术的关联细分领域,包括技术点、产品、应用等关键字信息。基于以上的内容,本课题的主要工作如下:1.针对TextRank算法提出的关键字集合中含有杂质词的问题,本文提出了KGCNN算法,用于提取并过滤出一部分杂质词。2.针对传统标签传播算法(LPA)算法在标签传播过程中没有考虑权重以及节点语义相关性的问题,本文提出了一种考虑权重和节点语义相关性的ELPA算法。3.完成央企科技创新资源管理服务平台模块的设计与开发,系统主要是根据用户提供的研究领域关键字对获取的数据(平台已有或定制爬取)进行关键字抽取、过滤、构建复杂网络,最后在构造的复杂网络上进行一系列的算法分析,对收集到的信息进行去粗取精、去伪存真等深层次的加工,进而为用户筛选出可靠、实用的信息。综上所述,本课题研究并提出KGCNN算法用于提取和过滤关键字,并在LPA的基础上提出了考虑权值和节点语义的ELPA算法用于在复杂网络中发现社区,并将上述算法应用到系统中,取得了不错的效果。