10.3778/j.issn.1002-8331.2011.24.056
基于句子相似度的论文抄袭检测模型研究
提出一种基于句子相似度的论文抄袭检测模型.利用局部词频指纹算法对大规模文档进行快速检测,找出疑似抄袭文档.根据最长有序公共子序列算法计算句子间的相似度,并标注抄袭细节,给出抄袭依据.在标准中文数据集SOGOU-T上进行的实验表明,该模型具有较强的局部信息挖掘能力,在一定程度上克服了现有的论文抄袭检测算法精度不高的缺点.
句子相似度、抄袭检测、局部词频、最长有序公共子序列
47
TP181(自动化基础理论)
国家自然科学基金the National Natural Science Foundation of China under Grant 60603023;辽宁省教育厅重点实验室项目LS2010180
2012-01-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
199-201