10.3969/j.issn.1003-9767.2021.11.016
基于机器学习的论文评分研究
本文首先利用Wordcloud库对评语文本进行可视化,将频率较高的无用词剔除,然后对教师评语进行中文分词,利用TF-IDF算法描述字词在一个语料库的重要程度,并将映射到特征空间的评语数值特征作为特征向量,然后利用稀疏主成分分析法对数据进行降维,将总评分作为论文等级的标识划分论文等级,最后使用支持向量机对其进行训练,使得分类器具有评判论文得分等级的功能.
稀疏主成分分析;支持向量机;多分类;混淆矩阵
33
TP391.1(计算技术、计算机技术)
2021-09-22(万方平台首次上网日期,不代表论文的发表时间)
共3页
54-56