10.3321/j.issn:1002-8331.2006.02.038
用于构建个性化门户的页面分解算法研究
为了帮助用户在低带宽、高延迟的情况下快速切入自己需要的页面,并自动得到页面中自己感兴趣的部分,该文提出了一个基于Web Component的页面分解算法.算法首先将HTML页面格式化为XHTML形式,然后根据XHTML页面生成XML DOM Tree,从中分析、抽取Web Component作为独立实体,并给这些Web Component分配标识,最后在数据库中存储页面结构、Web Component及相关信息,用于构建个性化门户.
门户网站、Web Component、XHTML、Xpath、XML Schema
42
TP393(计算技术、计算机技术)
国家科技攻关项目2002AA414060;陕西省西安市集成电路专项基金ZX04011
2006-04-13(万方平台首次上网日期,不代表论文的发表时间)
共4页
124-127