10.11896/j.issn.1002-137X.2016.1.006
一种改进的PrefixSpan算法及其在Web用户行为模式挖掘中的应用
序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式.针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接递归局部频繁项等方式进行改进,并将改进方法应用于Web用户行为模式挖掘中,对日志记录中的规律进行分析和研究.实验分析表明,相比PrefixSpan算法,该改进算法在算法效率方面有一定的提高.
序列模式挖掘、Web日志挖掘、PrefixSpan算法
43
TP181(自动化基础理论)
国家自然科学基金61202018,61305057,61303008;山西省青年科技基金2013021018-1;山西省高等学校科技创新项目2013102
2016-05-24(万方平台首次上网日期,不代表论文的发表时间)
共5页
25-29