基于归纳化会话的网络用户的聚类
为了发掘具有相似的访问兴趣的网络用户,探讨了网络用户聚类的问题.网络用户的访问信息从服务器的日志文件中抽取出来,组织成会话向量的形式,会话描述为一段时间内用户向服务器发出的一系列访问请求.为了减少会话向量的维度,根据网页的层次性,采用面向属性的推理方法,对这些会话进行了归纳.并且定义了一个新的距离测度来描述两个会话之间的相似度,最后采用某种非欧几里德的关系聚类算法聚类这些归纳化的会话.实验表明,这种方法对在大型的日志文件集中挖掘出有意义的网络用户的分类是高效可行的.
Web挖掘、面向属性的归纳、会话、会话距离、归纳化的会话
38
TP18;TP311.13;TP391(自动化基础理论)
国家自然科学基金69975024
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
1224-1228