10.3969/j.issn.1008-2441.2007.06.011
一种基于哈希技术的文本关联规则算法
采用新的关键字的获得方法,并基于DHP算法提出一种新的高效的文本关联规则算法.根据 TF‘IDF 公式计算特征词的权重,特征词的平均权重作为阈值,权重大于阈值的特征词作为该文本的关键词,将关键词的权重用到本文的算法ARTREE中,抽取出文本的关联规则.本文算法和Apriori算法相比,具有运算效率高、规则的精度高的优点.实验验证本算法的有效性.
哈希技术、文本、关联规则
9
TP18(自动化基础理论)
2008-05-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
36-39