基于分词矩阵模型的模糊匹配查重算法研究
针对中文文本查重的需求,利用分词的结果,将待查重的目标文本和查重样本文本转换为分词矩阵模型,然后扫描和分析矩阵,得到查重结果.由此提出了一种查重算法,并通过实例验证了该算法具有一定的实用效果.
相似度、分词矩阵模型、模糊匹配、查重算法
44
TP301(计算技术、计算机技术)
国家自然科学基金面上项目61672042;支持流式大数据实时联动的数据服务模型及方法研究资助
2018-01-24(万方平台首次上网日期,不代表论文的发表时间)
共7页
55-60,83