基于Markov的概念自动抽取算法

来源 :软件工程师 | 被引量 : 0次 | 上传用户:wusyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:提出了一种概念自动抽取算法,该算法的目的是从英文文本中抽取出由多个单词组成的概念。文中首先证明了概念的抽取过程是一个多个状态的齐次Markov链,然后给出了具体的抽取过程,即,如果多步转移概率达到所给定的阈值,则将这多个状态,即多个单词,看作是一个概念。为了对算法进行性能测试,借助网络爬虫,从网络中获取有关计算机领域的文本文档,采用本文算法进行概念抽取,结果显示该算法优于其他算法。 全文查看链接   (1)用空格将文档中的所有标点符号替换下来。 全文查看链接
其他文献
大数据时代的到来,使得计算机数据库技术在我国得到大力推广与应用,其应用范围也在逐渐拓展。它能够不断提升数据管理的效率与水平,并帮助人们减轻工作上的难度,进而优化工作
计算机已经成为现代社会发展与进步的重要工具,对于日常的生活与生产有着极为重要的作用和价值。为了进一步促进信息管理工作的顺利实施,一定要重视信息管理中数据库技术的实
<正>国家一级演员陈奇已经88岁了,依然活跃在荧屏上。去年下半年热播的电视剧《海棠依旧》中,"江南第一老太"陈奇扮演周恩来的养母,惟妙惟肖。有人夸她艺术生命长青,陈奇淡淡
渡槽作为跨越溪谷、河渠、道路和洼地的交叉渠系建筑物,广泛应用于区域调水、引水灌溉等工程。在现代大型渡槽建设中,大量采用了高强混凝土槽身结构。高强混凝土由于水泥用量