10.3772/j.issn.2095-915x.2024.03.008
基于关键特征增强的金融长文本事件分类
[目的/意义]为了解决长文本模型输入长度限制问题,通过抽取事件关键句和事件关键词,对长文本进行关键特征增强,以提高模型的特征表示能力.[方法/过程]基于关键特征增强的模型,在原文的基础上利用TextRank算法抽取事件关键句,并利用TF-IDF算法抽取事件关键词,将二者作为关键特征对长文本进行特征增强,再利用BERT和Self-Attention模型进行特征的进一步提取,最后进行事件分类.[局限]模型仅在金融领域事件分类上进行实验,可以考虑在其他领域内也进行实验并进一步验证模型效果.[结果/结论]在金融长新闻事件分类数据集上,提出的模型准确率达到88.40%,比基准模型提升了 2个以上的百分点,表明了模型的有效性.
事件分类、长文本分类、关键特征、特征增强、自注意力机制
10
G35;TP391(情报学、情报工作)
国家自然科学基金;国家社会科学基金
2024-09-18(万方平台首次上网日期,不代表论文的发表时间)
共10页
104-113