10.3969/j.issn.1000-0135.2004.02.004
基于概率神经网络的文本自动分类研究
本文提出了将一种径向基网络的重要变形--概率神经网络应用于文本自动分类的研究,与常用的K-最邻近法相比,具有一定的优势,特别是在训练集中各类的训练样本数很不平衡时;与BP等其他神经网络相比,其特点是需调节的参数少,不需确定隐层数、隐层中的神经元数量等网络结构,比较容易使用.此外,从研究中的不同特征选择的评价函数来看,它们对分类有一定的影响,应用X2统计进行特征选择的分类正确率最高,其次是文本证据权,而期望交叉熵的效果最差,说明特征选择在文本自动分类中也是非常重要的.
自动分类、概率神经网络、K-最邻近法
23
G25(图书馆学、图书馆事业)
2004-06-04(万方平台首次上网日期,不代表论文的发表时间)
共5页
147-151