期刊专题

10.11925/infotech.2096-3467.2021.0973

基于Paragraph-BERT-CRF的科技论文摘要语步功能信息识别方法研究

引用
[目的]致力于自动识别科技论文摘要中的语步功能信息,明确论文的研究目的、研究方法、研究结果和研究结论,有助于快速获取文献主要内容,实现智能化语义检索.[方法]提出基于Paragraph-BERT-CRF神经网络架构的摘要语步识别模型,能够充分利用摘要文本中的篇章上下文信息,同时考虑了注意力机制和语步标签序列内部的转移关系.[结果]基于94 456条科技论文摘要数据集进行方法实证,Paragraph-BERT-CRF的加权平均精确率为97.45%、加权平均召回率为97.44%、加权平均F1值为97.44%.通过对比CRF、BiLSTM、BiLSTM-CRF、BERT、BERT-CRF、Paragraph-BERT等模型的消融实验结果,验证了本文方法的有效性.[局限]Paragraph-BERT-CRF模型仅使用了基础BERT-base预训练语言模型,模型参数有待进一步优化,更多预训练语言模型在语步功能信息识别中的应用有待研究.[结论]引入注意力机制和篇章上下文信息,能有效提升模型的预测效果,达到摘要语步信息识别的功能.

语步、自注意力机制、段落上下文、BERT

6

TP391;G202;G255(计算技术、计算机技术)

中国科学技术信息研究所重点工作项目;中国科学技术信息研究所创新研究基金面上项目;中国科学技术信息研究所创新研究基金青年项目

2022-06-23(万方平台首次上网日期,不代表论文的发表时间)

共10页

298-307

暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

6

2022,6(2)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn