10.3778/j.issn.1002-8331.1208-0521
基于主题的文档与代码间关联关系的提取研究
软件文档及其程序代码之间的关联性或可追踪性分析是软件分析、理解的重要基础.探讨了软件的中文文档和程序代码中蕴含的主题及其相关性.针对软件文档的章节结构和词汇空间,以及程序代码结构、标识符命名空间、注释风格等方面的特点,在LDA模型的基础上提出了一种基于主题词的软件中文文档与代码间关联关系的分析方法.该方法依据词汇的香农信息提取文本段的主题词.实验结果表明,主题词分析方法与LSI模型分析方法相比在查全率和查准率上均有2%到5%的提高.
可追踪链、主题模型、隐含狄利克雷分配(LDA)、逆向工程
49
TP311.5(计算技术、计算机技术)
2013-07-15(万方平台首次上网日期,不代表论文的发表时间)
共7页
70-76