基于万有引力定律和PageRank的页面分类系统构建方法研究
当前文本分类方法由于没有考虑页面之间相互关系,因而分类效率有限.鉴于此,受万有引力定律启发,提出基于万有引力定律和PageRank的页面分类方法.该方法的基本思路是通过分析页面之间的链接关系,将类属未知的页面划分到对其影响较大的一类.以上述分类方法为基础,构建了基于万有引力定律和PageRank的页面分类系统.该系统包括页面预处理、页面向量表示、页面分类以及分类结果评价等模块.真实数据集上的比较实验表明所提方法的有效性.
万有引力定律、PageRank、页面分类系统
33
G254(图书馆学、图书馆事业)
国家自然科学基金;山西省高等学校科技创新项目;全国教育信息技术研究规划课题十二五;山西大学商务学院科研项目
2015-06-30(万方平台首次上网日期,不代表论文的发表时间)
35-38