论文部分内容阅读
软件的开发及维护过程中经常要对代码进行搜索.基于关键字匹配的代码搜索面临与传统信息检索一样的问题,即用户查询关键字与代码文本用词不匹配.为提高代码搜索精度,需要挖掘软件中的语义相关词进行查询扩展.本文针对软件工程领域设计了一种基于Word Embedding的语义相关词挖掘方法,并且采用IT技术问答网站Stack Overflow的文档作为语料库训练得到了共包含19332个单词的语义相关词表.与前人工作的对比实验验证了本文方法挖掘的语义相关词能有效提高代码搜索精度.