10.3969/j.issn.1006-2475.2017.09.004
基于Word Embedding的软件工程领域语义相关词挖掘方法
软件的开发及维护过程中经常要对代码进行搜索.基于关键字匹配的代码搜索面临与传统信息检索一样的问题,即用户查询关键字与代码文本用词不匹配.为提高代码搜索精度,需要挖掘软件中的语义相关词进行查询扩展.本文针对软件工程领域设计了一种基于Word Embedding的语义相关词挖掘方法,并且采用IT技术问答网站Stack Overflow的文档作为语料库训练得到了共包含19332个单词的语义相关词表.与前人工作的对比实验验证了本文方法挖掘的语义相关词能有效提高代码搜索精度.
代码搜索、查询扩展、语义相关词
TP311(计算技术、计算机技术)
国家自然科学基金资助项目61572312,61572313;上海市科委科研项目15DZ1100305
2017-10-31(万方平台首次上网日期,不代表论文的发表时间)
共6页
19-23,49