论文部分内容阅读
该文尝试利用领域知识库,实现受限领域中文文本内容主题概念识别,并尝试利用领域概念建立特征向量,实现受限领域文本与主题概念的相关度计算。其中,利用领域知识库进行主题特征识别,利用知识库中概念间的关系进行特征项权重的计算,并利用knn算法进行文本与主题概念的相关度计算。实现了基于词汇分析技术和基于领域知识计算相结合的方式下,受限领域中文文本内容主题概念的识别和文本与主题概念的相关度计算。实验结果显示,主题识别平均正确率为79%文本与主题概念的相关度计算的正确率达到62%。