10.13954/j.cnki.hdu.2019.03.010
基于Focal Loss-2函数的中文短文本情感分类研究
利用深度学习中的卷积神经网络CNN和长短期记忆人工神经网络LSTM两种方法,结合word2vec词向量工具,对互联网中文短文本平衡数据集进行情感分类,并与传统的机器学习方法进行比较,得到最优的模型.在不平衡数据集上,提出了基于Focal Loss函数改进的二分类平衡交叉熵损失函数Focal Loss-2.实验表明:深度学习算法LSTM-word2vec模型分类准确率最高,达到93.13%;CNN-word2vec模型的训练时间最短,每轮用时27 s;在正类样本少时,Focal Loss-2函数比常用的交叉熵函数正类的模型评价F 1值提高了4%左右.统计检验表明:基于Focal Loss-2函数改进的模型在不平衡数据集上的分类性能显著优于以前的模型.
情感分类、不平衡数据集、卷积神经网络、长短期记忆人工神经网络、FocalLoss-2
39
TP391(计算技术、计算机技术)
国家社会科学基金资助项目17BTJ023
2019-06-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
54-59