10.3969/j.issn.1671-1815.2005.12.008
基于概念树的主题爬取技术研究
提出了一种新型主题爬取方法.采用概念树构造主题层次图,赋予待爬取URL对象以层次语义信息,按照语义相关性与重要性选择待爬取URL对象,搜索属于特定语义相关主题的重要Web文档的WWW子集.
概念、概念树、主题爬取、主题层次
5
TP393.03(计算技术、计算机技术)
教育部科学技术研究项目200146
2005-07-21(万方平台首次上网日期,不代表论文的发表时间)
共7页
785-790,796