论文部分内容阅读
针对为检索服务的语义知识库存在的内容不全面和不准确的问题,提出一种基于维基百科的软件工程领域概念语义知识库的构建方法。以SWEBOK V3概念为标准,从维基百科提取概念的解释文本,并抽取其关键词表示概念的语义;通过概念在维基百科中的层次关系、概念与其他概念的解释文本关键词之间的链接关系、不同概念解释文本关键词之间的链接关系构成概念语义知识库;利用LDA主题模型分别与TF-IDF、Text Rank算法相结合的两种方法抽取关键词;对构建好的概念语义知识库用随机游走算法计算概念间的语义相似度。将实验结果