程序代码相似度检测技术的研究与实现
针对传统相似度算法应用在程序设计课程作业检测中精度较低这一问题,通过研究最长公共子序列等算法,发现其优缺点,在分析的基础上,结合结构度量技术和属性技术两种技术,提出一种性能较好的程序相似度计算方法.方法首先对源程序进行初步处理,将程序中的注释语句和空格删除,再次确定常用元素及常用结构,然后利用Lex统计、抽取程序元素;利用开源代码ucc生成语法树,之后抽取相应的语法结构;最后生成特征向量,并计算代码相似度.实验结果表明该方法比最长公共子序列算法精度提高了10.6%.
属性计数法、结构度量技术、相似度度量
13
TP311(计算技术、计算机技术)
西安交通工程学院校级教改项目150006B
2017-05-05(万方平台首次上网日期,不代表论文的发表时间)
共2页
39-40