10.11959/j.issn.1000-436x.2024117
基于局部增强的中文医疗命名实体识别模型
医学实体的识别往往受到其相邻上下文的影响,目前的命名实体识别方法通常依赖于BiLSTM捕捉文本中的全局依赖关系,缺乏对字符之间局部依赖关系的建模.针对这一问题,提出了一种基于局部增强的中文医疗命名实体识别模型LENER.首先,LENER使用包括字音、字形和语义在内的多源信息来丰富底层字符表征.然后,结合相对位置编码对滑动窗口划分出的序列片段进行局部注意力计算,并通过非线性计算融合局部信息和BiLSTM得到的全局信息.最后,对识别出的实体头部和尾部进行组合,进而提取出实体.实验结果表明,LENER模型具有良好的实体识别能力,与其他模型相比,LENER模型的F1值提升了0.5%~2.0%.
中文命名实体识别、上下文环境、注意力机制、多源信息、滑动窗口
45
TP391.1(计算技术、计算机技术)
2024-08-13(万方平台首次上网日期,不代表论文的发表时间)
共13页
171-183