10.11925/infotech.2096-3467.2020.1221
基于人工特征和机器特征融合的科技文献知识元抽取
[目的]基于深度学习的方法将科技文献的人工特征和机器特征进行融合,有效提升知识元抽取的效率.[方法]基于科技文献特征,构建26个人工特征指标,主要包括三个层面,即篇章、句子、字词,并将其与Word2Vec和one-hot等机器特征基于LSTM、CNN、BERT模型从横向、纵向进行特征融合,完成知识元抽取.[结果]特征纵向融合对知识元的抽取准确率最高约为0.91,与当时最传统方法效果相比提升约6个百分点.[局限]当数据量过大时,深度学习模型运行占用内存过大,需要后续进行优化.[结论]人工特征和机器特征纵向融合方式可以有效提升知识元抽取效果.
知识元抽取;人工特征;机器特征;科技文献
5
G250;TP391(图书馆学、图书馆事业)
本文系国家社会科学基金面上基金项目项目编号:19BXW110
2021-11-08(万方平台首次上网日期,不代表论文的发表时间)
共12页
132-143