10.3969/j.issn.1671-1815.2015.11.042
基于结构特征聚类的相似代码检索方法
针对基于图的相似代码检测方法复杂度高、对代码多样化识别能力有限等问题,提出基于结构特征聚类的方法.首先将代码表示为控制依赖树,在此基础上执行代码标准化,消除代码表达方式的多样化,以便识别语法表示不同,而语义相似的代码;然后采用特征向量描述程序的结构信息,将复杂的图的相似度求解问题转换为简单的相似向量的聚类问题,快速提取可能相似的候选代码.实验结果表明,方法与Gabel等人提出的方法相比,可以识别更多的代码多样化.
相似代码、语义分析、向量聚类
15
TP311.12(计算技术、计算机技术)
哈尔滨学院青年基金HUYF2014-007;黑龙江省普通高校青年学术骨干项目1254G037;黑龙江省教育规划青年专项课题GJD1214038;国家自然科学基金资助项目61202092;高等学校博士学科点专项科研基金资助项目20112302120052;哈尔滨科技创新人才研究专项资金项目RC2013QN010001和 2014RFQXJ062;黑龙江省自然科学基金F201127
2015-06-09(万方平台首次上网日期,不代表论文的发表时间)
共5页
221-225