10.3969/j.issn.1671-1815.2019.33.044
基于遗传算法的文本特征选择
文本特征选择是自然语言处理中的关键问题.针对文本特征的高维性和稀疏性问题,在过滤式特征选择算法文档-逆文档评率(term frequency-inverse document frequency,TF-IDF)的基础上,提出了用遗传算法对文本特征进行优化选择,使其最大程度地贴合后续的文本分类算法,在保证文本分类精确度的同时,降低特征维度以缩减预测时间.实验显示,该算法与单一的过滤式文本特征选择算法相比,能够有效减少所选文本特征数量(即降低特征维度),能有效提高文本的分类能力.
文本分类、文本特征、特征降维、遗传算法
19
TP391.14(计算技术、计算机技术)
2019-12-31(万方平台首次上网日期,不代表论文的发表时间)
共6页
302-307