面向大规模学术论文关键字网络社区发现算法的研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:muyiwenwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近几年,复杂网络在科学研究中变得越来越活跃。随着人们对复杂网络的性质的深入研究,人们逐渐发现了复杂网络中存在的一些共同性质,比如无标度特性、社区结构等。复杂网络中的社区结构可以看作是现实世界中关系的一种映射,比如在学术合作的网络中,研究共同课题或比较类似课题的人员也会组成一个团体。在学术论文关键字网络中,联系比较紧密的技术或方法会组成一个技术社区。这时,如何快速有效的在大型复杂网络中找到较好的社区结构就成为了研究者比较关注的问题。社区发现研究就是在这种背景下产生的。本课题致力于从大量科研文章中提出关键字,并对提出的关键字进行过滤,进而构建大型关键字复杂网络,然后使用技术关联性分析方法,对技术进行分层的社区划分,构成层次化技术社区体系,挖掘出该技术的关联细分领域,包括技术点、产品、应用等关键字信息。基于以上的内容,本课题的主要工作如下:1.针对TextRank算法提出的关键字集合中含有杂质词的问题,本文提出了KGCNN算法,用于提取并过滤出一部分杂质词。2.针对传统标签传播算法(LPA)算法在标签传播过程中没有考虑权重以及节点语义相关性的问题,本文提出了一种考虑权重和节点语义相关性的ELPA算法。3.完成央企科技创新资源管理服务平台模块的设计与开发,系统主要是根据用户提供的研究领域关键字对获取的数据(平台已有或定制爬取)进行关键字抽取、过滤、构建复杂网络,最后在构造的复杂网络上进行一系列的算法分析,对收集到的信息进行去粗取精、去伪存真等深层次的加工,进而为用户筛选出可靠、实用的信息。综上所述,本课题研究并提出KGCNN算法用于提取和过滤关键字,并在LPA的基础上提出了考虑权值和节点语义的ELPA算法用于在复杂网络中发现社区,并将上述算法应用到系统中,取得了不错的效果。
其他文献
<正>持有至到期投资减值及减值后利息收入和利息调整的确认问题,一直被认为是该金融资产核算上的难点问题。本文将尝试分析难点产生的原因,并在此基础上探讨持有至到期投资减
以亮度值(L*)与屠宰24h后的pH值(pH24h)作为区分类PSE肉与正常鸡肉的指标,对两者肉糜的流变特性、质构特性和蒸煮损失进行研究。结果表明:具有低pH24h、高L*值的类PSE肉,在流变性、
<正> 我场大部分耕地一般已开垦20年以上,由于大面积连年耕种,有机质等元素被植物吸收并随着作物的收割而带走。随着开垦年限的不断增长,加之,多年来很少施用有机肥料,更加重
目的分析脑梗塞患者的个性化护理干预及对康复功能的影响。方法选取我院于2017年1月至2018年1月收治的脑梗塞患者84例,将其根据不同护理方法均分为实验组(42例,采用个性化护
社会经济飞速发展的大环境下,个人客户的金融消费需求逐渐展现出多样性、个性化特征,银行利润的主要增长点也转向个人银行业务。本文简要分析银行个人消费贷款产品营销存在的
目的:观察正天胶囊治疗偏头痛的临床疗效。方法:将48例偏头痛患者随机分为对照组与治疗组各24例。治疗组给予正天胶囊治疗;对照组给予西比灵治疗。疼痛难以忍受者可服用芬必
<正>一、引言资本结构是指企业各种资本的构成及其比例关系。目前国内外资本结构实证研究方向主要有:一是以MM定理为中心,探讨企业价值与资本结构之间的关系,这是资本结构的
《人生》和《红与黑》都是以政治为经、爱情为纬来编织情节,塑造主人公的形象的。《人生》的主人公高加林和《红与黑》的主人公于连,不仅“形”似,而且“神”同,我们通过比较研究