10.3969/j.issn.1002-5316.2012.01.014
基于分词技术的中文网站内容分类方法
随着互联网技术的飞速发展,如何有效地组织和管理就成了人们首先需要解决的问题。本文提供了一种基于网站内容对互联网站进行分类的方法。研究并探讨了实现网站分类方法的一系列关键技术,包括分类体系的确定,训练集的建立,文本预处理,特征提取和分类器的实现。最后给出了该网站分类方法的分类质量实验结果。
分类体系、文本预处理、特征提取
TP393.092(计算技术、计算机技术)
2012-06-02(万方平台首次上网日期,不代表论文的发表时间)
共4页
49-52