论文部分内容阅读
为了提高中文领域本体概念抽取的准确率和召回率,提出一种多策略的中文领域本体概念抽取方法。该方法使用模式匹配法改进原有的单字合并法,经词性过滤和缺陷检测筛选出概念集组成用户词典,并送入概念抽取系统进行二次分词获得候选概念集;利用词频-逆向文本频率(TFIDF)方法和信息熵融合得到TFIDFE方法,计算概念权重以获得领域概念集。实验结果表明,该方法在领域术语抽取的准确率、召回率和F值上均有较好的效果。