10.3321/j.issn:1000-0054.2008.07.022
研究中文文本分类技术的辅助平台
为方便中文文本分类过程算法研究,阐述中文文本分类的基础技术,提出基于构件的中文文本分类技术研究辅助平台.该平台对大多数分类中使用的算法在中文文本分类中的应用效果进行了研究.实验结果表明: 该平台可以通过计算分类器分类准确率的宏平均值比较分类算法与特征选择算法的性能,可以评估语料库的可用性,能够用于研究中文分词、特征选择、分类算法等中文文本分类技术问题.
自动文本分类、中文分词、特征选择、分类算法
48
TP391.1(计算技术、计算机技术)
国家自然科学基金60573017;国家海洋局数字海洋项目908-03-01-13
2008-10-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
1150-1153