基于融合词性的BiLSTM-CRF的期刊关键词抽取方法

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:aaaaeeettjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]利用CRF模型处理序列标注问题的优势,通过将词性信息和CRF模型融入BiLSTM网络,实现期刊关键词的自动抽取.[方法]将关键词抽取问题视为一个序列标注问题.对期刊文本进行分词和词性标注的预处理;对预处理后的文本使用Word2Vec模型进行Word Embedding向量化,获取字词的向量表达式;使用BiLSTM-CRF模型进行关键词的自动抽取.[结果]使用融合词性的BiLSTM-CRF网络,在采集的知网期刊文本上进行实验,在简单关键词方面,准确率较原始的BiLSTM模型提升3%;在复杂关键词方面,准确率较原始的BiLSTM模型提升12%.[局限]期刊关键词抽取模型无法准确抽取复杂关键词,需要针对复杂关键词层面进一步提升模型性能.[结论]融合词性的BiLSTM-CRF模型与传统方法相比,具有较高的识别准确率,是一种有效的关键词抽取方法.
其他文献
幼儿教育一直都是教育界重点关注的对象,为了在教育工作的开展上取得更好的成绩,需进一步加强教学活动的创建。幼儿数学活动的落实,应激发幼儿的学习潜力,鼓励他们在知识的学习、
作为党校系统“末梢”的县级党校,在乡村振兴战略中具有不可替代的地位,要充分发挥理论宣传和科研决策能力,助推乡村振兴战略。党校教师要认真学习贯彻党的十九大精神,坚持“
传统的单一主体治理模式已经很难适应日益分散化的农村社会,农村社区化成为了农村社会治理现代化的普遍选择。基于从分散到集聚的基本逻辑,“合村并居”“撤村建居”“多村合
期刊
随着教育体制的改革与发展,幼儿音乐教育在幼儿教学中的重要地位也逐渐地突显出来,对于幼儿的智力开发、陶冶情操和审美能力的提高都有着较大的促进作用,但在实际教学过程中又常
文章对区县级博物馆文创产品的开发与利用展开研究和分析,首先对博物馆文创产品概念进行阐述,其次在博物馆文创产品开发现状中找到其中存在的不足,最后对文创产品开发与利用
士阶层是先秦时期社会动荡和变革的直接产物,他们以道自任,坚持士的尊严,为建立理想的社会秩序奔走呼号,逐渐凝聚为一种时代精神,我们称之为“士精神”.文章通过对春秋战国士
在现代信息技术不断发展,教育信息化不断普及的新时代,多媒体技术教学已经逐渐成为我们幼儿教师开展教学活动的教学形式之一。下面我将从提高教师自身运用多媒体技术能力;在多媒
艺术与生活密不可分,生活是艺术的源泉,写生是艺术创作的重要环节.历来卓有成就的艺术家们都重视生活,重视艺术与自然、社会的关系,依照“外师造化,中得心源”的原则进行创作
中国传统文化讲究礼仪和品德,从古至今都是国人所遵循的准则。关于教育层面同样如此,不论年纪大小,都需要通过文化素养的教育。良好的品德素养是从小开始培养,通过教师和家长的共