10.11896/j.issn.1002-137X.2017.04.008
基于LDA的软件代码主题摘要自动生成方法
理解软件代码的功能是软件复用的一个重要环节.基于主题建模技术的代码理解方法能够挖掘软件代码中潜在的主题,这些主题在一定程度上代表了软件代码所实现的功能.但是使用主题建模技术所挖掘出的代码主题有着语义模糊、难以理解的弊端.潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)技术是一种比较常用的主题建模技术,其在软件代码主题挖掘领域已取得了较好的结果,但同样存在上述问题.为此,需要为主题生成解释性文本描述.基于LDA的软件代码主题摘要自动生成方法除了利用主题建模技术对源代码生成主题之外,还利用文档、问答信息等包含软件系统功能描述的各类软件资源挖掘出代码主题的描述文本并提取摘要,从而能够更好地帮助开发人员理解软件的功能.
软件代码、LDA、代码功能挖掘、软件文档、摘要
44
TP301(计算技术、计算机技术)
国家自然科学基金61472007;质检公益性行业科研专项201510209;国家重点专项2016YFB1000801
2017-05-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
35-38