10.3969/j.issn.1674-1374-B.2009.03.023
基于机器学习的Web文本分类技术及算法
提出了一种基于机器学习的Web文本自动分类的信息检索解决方案.采用层次约束法完成文本自动抓取功能,文本频度与词条频度相结合的文本特征选择算法实现特征提取,并采用特征加权技术进一步提高文本分类性能.该算法不仅实现中文文本的自动分类,有效地提高Web信息检索的精度,而且能大大降低人工二次浏览筛选的工作量,还可用于电子政务和电子商务信息的自动分类.
网络蜘蛛、特征选择、文本分类、特征加权、朴素贝叶斯
30
TP391.1(计算技术、计算机技术)
江苏省科技攻关项目BE2006357
2009-07-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
347-351