论文部分内容阅读
摘要:提出了一种概念自动抽取算法,该算法的目的是从英文文本中抽取出由多个单词组成的概念。文中首先证明了概念的抽取过程是一个多个状态的齐次Markov链,然后给出了具体的抽取过程,即,如果多步转移概率达到所给定的阈值,则将这多个状态,即多个单词,看作是一个概念。为了对算法进行性能测试,借助网络爬虫,从网络中获取有关计算机领域的文本文档,采用本文算法进行概念抽取,结果显示该算法优于其他算法。
全文查看链接
(1)用空格将文档中的所有标点符号替换下来。
全文查看链接