10.3969/j.issn.1009-3044.2011.10.003
Web日志预处理技术探析
随着Internet的普及,Web日志挖掘成为一个新的研究课题.由于Web日志数据的半结构化,为了得到有效的挖掘模式,提高挖掘算法的效率,首先需要对数据预处理.该文详细介绍了Web日志数据预处理的四个步骤:数据清洗,用户识别,会话识别和路径补充,并实现了对某校院网日志记录的预处理,得到了理想的结果.
数据预处理、数据清洗、用户识别、会话识别
7
TP393(计算技术、计算机技术)
安徽科技学院引进人才基金项目ZRC2008176;安徽省教育厅自然科学基金项目KJ2009B121Z
2011-07-18(万方平台首次上网日期,不代表论文的发表时间)
共2页
2222-2223