LCS算法在术语抽取中的应用研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:h4975915
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了一种基于最大公共子串(Longest Common Substring,LCS)算法的术语抽取方法:按标点符号对领域文档进行切分;抽取切分后的语句片断的所有最大公共子串作为候选术语集;通过停用词过滤、对照领域词筛选和术语嵌套子串筛选等规则进行判别,得到最终的术语集。通过学前教育领域术语抽取的实验,验证了该算法可以有效地抽取中文领域术语:术语抽取平均准确率达84.2%;4~6字符双词术语抽取的效果尤佳,准确率接近100%。
其他文献
目的分析急性脑血管意外患者给予不同院前急救方式的效果。方法选取我院2016年3月—2018年3月收治的急性脑血管意外患者160例,根据随机数字表法分为对照组和观察组,每组80例
科学技术是推动社会进步的主要动力,会计作为社会中的重要组成,也深受网络科技的影响。为顺应时代的发展,云会计应运而生。文章简要分析了云会计的基本信息,就“互联网+”背
引子2020年,产业园区经济在我国市场生态中依然扮演着十分重要的角色。相关研究成果显示,目前我国GDP约有四分之一来自于产业园区经济。产业园经济在迅猛发展的过程中呈现出
目的研究乌灵胶囊联合腹针治疗脑卒中后疲劳的疗效,并探讨脑卒中后疲劳炎症因子变化及可能作用机制。方法选择2016年1月~2017年9月浙江省丽水市人民医院住院的90例脑卒中后疲