10.3321/j.issn:1000-0054.2005.01.030
网络日志挖掘中基于时间间隔的会话切分
针对网络日志挖掘中的会话切分问题,提出了一种基于时间间隔的方法.该方法在相邻页面访问时间间隔超出某阈值时切分会话,针对特定IP的阈值根据其频率矢量来定义.实验表明: 代理服务器IP和单用户IP的频率矢量具有不同特性,代理服务器IP的频率矢量具有Power-law的特点,而单用户IP的频率矢量具有Gauss分布的特点,在此基础上提出一种基于Gauss假设的方法来设定不同单用户IP的阈值.与传统的对所有IP地址使用单一的先验阈值进行切分的方法相比,该方法更为合理有效.
数据库理论、网络日志挖掘、会话切分、时间间隔、频率矢量
45
TP311.131(计算技术、计算机技术)
2005-03-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
115-118