10.3321/j.issn:1002-0470.2005.09.002
面向中文特定信息变异的过滤技术研究
研究了如何快速识别并过滤经过变异处理的中文信息的技术,并将变异规则限定在当前中文网络最常见的5种变异方法上.提出了一个快速而准确的中文信息多模式模糊匹配算法,该算法在WM算法的基础上融合了压缩编码的思想,适于实时地对网络信息进行处理.实验表明,基于该算法的信息过滤系统能够支持大量的输入模式,系统对模式的识别准确率超过了99%,并且达到了很高的执行效率.该算法在中文信息过滤领域有着广阔的应用前景.
多模式匹配、模糊匹配、信息过滤
15
TN91
国家高技术研究发展计划863计划2002AA147020-11;国家自然科学基金60435020
2005-11-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
7-12