期刊专题

10.11925/infotech.2096-3467.2020.1296

基于ELECTRA模型与词性特征的金融事件抽取方法研究

引用
[目的]针对金融事件抽取中金融事件实体边界模糊、抽取不准确的问题,提出基于预训练模型ELECTRA和词性特征的金融事件抽取方法.[方法]为增强模型对金融关键实体的感知力,充分考虑语料原始的语义信息以及词性特征信息,将语料分别通过两个ELECTRA预训练模型后进行融合操作,达到增强语义的效果;将学习到的信息传入BiGRU中,获取上下文长距离的语义依赖,输出原始的序列标签;利用CRF克服标签偏差问题,通过上述步骤完成金融事件抽取.[结果]基于预训练模型ELECTRA和词性特征的金融事件抽取方法在金融事件数据集上F1值达到70.96%,比经典的抽取模型BiLSTM-CRF性能提升20.74个百分点.[局限]数据集中事件数较少,预训练模型体积较大,会受到GPU/TPU内存的限制.[结论]本文模型能够更加全面地捕捉金融事件元素之间的联系,提升金融事件抽取的效果.

ELECTRA;词性特征;金融事件抽取;预训练模型

5

TP183(自动化基础理论)

本文系国家自然科学基金青年项目;国家自然科学基金重大研究计划培育项目;国家自然科学基金青年项目

2021-09-30(万方平台首次上网日期,不代表论文的发表时间)

共12页

36-47

暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

5

2021,5(7)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn