10.3969/j.issn.1002-1965.2022.11.023
融合BERT与多尺度CNN的科技政策内容多标签分类研究
[研究目的]为实现科技政策文本内容的自动编码与多主题分类,探索一种融合BERT模型和多尺度CNN模型的多标签分类方法,得到更加丰富的政策语义特征信息.[研究方法]针对科技政策内容句的信息密度大、内涵分布不均衡等特点,通过BERT充分提取政策内容的上下文信息,增强文本的语义特征表示;然后利用多尺度、多通道的CNN-Inception模块提取更多尺度的特征,通过捕获文本的局部特征与组合不同尺度的语句特征,提升模型在多标签分类任务上的性能.[研究结论]对比实验表明,与单一BERT分类模型相比,文中提出的BERT-多尺度CNN模型的召回率与Micro-F1值显著提高,提升了科技政策多标签分类的效果.
科技政策、文本内容分类、多标签分类、BERT模型、多尺度CNN
41
TP391(计算技术、计算机技术)
国家社会科学基金20CTQ030
2022-12-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
157-163