10.3772/j.issn.1673-2286.2022.01.002
基于BERT模型的科技政策文本分类研究
在智慧政务的应用背景下,利用深度学习的方法对海量的科技政策文本数据进行自动分类,可以降低人工处理的成本,提高政策匹配的效率.利用BERT深度学习模型对科技政策进行自动分类实验,通过TextRank算法和TF-IDF算法提取政策文本关键词,将关键词与政策标题融合后输入BERT模型中以优化实验,并对比不同深度学习模型的分类效果来验证该方法的有效性.结果表明,通过BERT模型,融合标题和TF-IDF政策关键词的分类效果最佳,其准确率可达94.41%,证明利用BERT模型在标题的基础上加入政策关键词能够提高政策文本自动分类的准确率,实现对科技政策文本的有效分类.
科技政策、文本分类、BERT模型、关键词提取
TP311(计算技术、计算机技术)
山东省高等学校青创科技支持计划2020RWG009
2022-03-16(万方平台首次上网日期,不代表论文的发表时间)
共7页
10-16