10.3969/j.issn.1000-0135.2004.05.006
一种Web多维分析模型及应用
Web上的网页正以惊人的速度增长和变化,给传统搜索引擎的效率和质量带来了许多新的问题和挑战.我们迫切需要一种研究方法,能够对搜索引擎收集来的海量网页进行有效的分析,以便对Web保持完整清晰的认识来指导搜索引擎进行更有效的服务.本文提出一种基于时间、空间和内容的三维Web分析模型,通过它可以对海量的网页数据进行多维度、多层次的分析工作,为我们认识Web提供一种全新的视角.在实验中我们简单地实现了该模型,并通过对3批网页数据进行分析,得到网页变化率、网页空间分布、复制强度大的网页特点等数据,以及Internet作为"第四媒体"在信息传播上的一些特点.
Web、网页、搜索引擎、数据挖掘
23
TP3;P20
中国科学院计算机科学重点实验室基金SYSKF0302
2005-01-06(万方平台首次上网日期,不代表论文的发表时间)
共8页
553-560