10.11925/infotech.2096-3467.2021.1414
基于神经网络的医药科技论文实体识别与标注研究
[目的]为提高医药实体识别的效果、实现医药新知识的挖掘和提高医药科技论文的利用率,提出一种新的实体识别模型.[方法]构建基于Attention-BiLSTM-CRF的医药实体识别模型,在公开数据集GENIA Term Annotation Task和BioCreative Ⅱ Gene Mention Tagging上分别对模型进行测试,进而使用该模型对生物医药论文的摘要进行实体标注.[结果]本文提出的模型优于其他基准模型,在两个数据集上的F1值分别为81.57%和84.23%、准确率分别为92.51%和97.85%,并且在数据不平衡的情况下更有优势.[局限]实体标注实验数据量和应用范围较为单一.[结论]基于Attention-BiLSTM-CRF的医药实体识别模型可以提高实体识别效果并实现医药新知识的挖掘.
生物医药实体识别、实体标注、神经网络、注意力机制
6
G350(情报学、情报工作)
广州市科技计划基金项目202002020036
2023-01-11(万方平台首次上网日期,不代表论文的发表时间)
共13页
100-112