改进TextRank的文本关键词提取算法

来源 :软件导刊 | 被引量 : 0次 | 上传用户:adaibaobao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词提取作为自然语言处理(NLP)的重要步骤,其作用是挖掘文本主题,通过几个词高度概括文本内容,在信息检索、文本挖掘中应用广泛。选出的关键词必须包含以下3个特性:易于理解、与文本高度关联、能很好地覆盖文本内容。对TextRank算法进行改进,将一段文本分成若干部分,对其中的每个部分构建关键词图,并在每一部分中提取若干关键词,最后根据词频、长度、位置和词性等综合因素进行打分,选出最终的关键词。通过实验得出,该算法相比传统的TextRank算法准确率提高了2.3%。改进TextRank算法改善了传统Tex⁃
其他文献
舟山渔船水上交通事故频发,给社会造成了巨大损失。总结了传统救生设备的主要缺陷,基于智能救生设备的发展现状和特点优势,提出将水上智能救生设备应用于舟山渔船的解决办法,
利用1965-2007年沙澧河流域12个气象站的逐月气候资料,采用FAO推荐的彭曼-孟蒂斯公式计算潜在蒸散量,分析了沙澧河流域43 a潜在蒸散量的变化趋势,并在ArcGIS环境下通过Spline
通过对2008年5月3日发生在驻马店市正阳县的大暴雨过程中的环流形势、稳定度及多普勒雷达产品的分析发现:驻马店地区K指数=38℃、SI=-2.0℃、△θse=3.8℃,大气层结极不稳定,为大
为了解决传统机器学习算法对社交网络异常用户检测准确率不高的问题,提出一种基于信息增益的K近邻社交网络异常用户检测方法。首先通过使用信息增益特征选择方法确定数据集中
资本主义在其几百年的发展过程中,不仅创造了物质文明,而且孕育了创新文化.资本主义创造的文明是人类文明进步的一个重要台阶,我们需要研究和借鉴资本主义推动生产力不断向前发展
融资是企业资本运作的起点,也是企业收益分配赖以遵循的基础.从分析科技中介机构应选择的融资方式入手,建立了科技中介机构的融资机制模型,并提出了完善融资机制所采取的途径.
在分析基于特征矩阵的主存故障检测方法原理的基础上,介绍了检测地址位及数据位故障时特征矩阵存在的条件及其确定方法.针对微机保护系统,给出了可用于其主存故障检测的特征矩阵
网络技术的出现为社会构筑了一个与现实物理空间迥异的虚拟空间,网络文化是随网络技术出现后必然产生的一种文化结构,而大学生上网族日趋壮大,网络对其思想观念、思维方式、价值
太原大学图书馆始建于1984年5月。随着学校的不断发展壮大,图书馆也从小到大,发生了巨大的变化。1997年旧校区新馆落成,建筑面积4500平方米。2011年搬迁入驻新校区,现图书馆建筑
伴随着知识全球化的发展,单一组织的有效资源已无法满足技术创新的要求,于是出现了跨领域的组织特征,技术合作、技术联盟、网络创新组织等相继出现。从组织的技术核心能力入手,对