基于知识增强的命名实体识别方法研究
命名实体识别作为自然语言处理中一项十分基础的任务,其目的是从一段用自然语言描述的文本中识别出相应的实体及类型.知识图谱作为以三元组形式存在的外部知识,已经在很多 自然语言处理任务中得以应用 并取得了良好效果.文中提出了一种基于知识图谱信息增强的注意力对齐命名实体识别方法,首先通过嵌入层和注意力机制嵌入知识图谱信息,获取知识图谱三元组信息的表示;其次通过BERT-BiLSTM 获取句子的 上下文表示;然后 通过一种注意力对齐模块分配三元组权重融合知识图谱信息与句子信息的表示;最后通过softmax控制融合后的表示向量的预测输出,进而获取实体的标签.该方法有效避免了因知识图谱的融合而改变原句子的语义信息,同时也使得句子中的词向量具有丰富的外部知识.所提方法在中文通用数据集 MSRA和医疗领域专用数据集 Medicine上的F1值分别达到了 95.73%和93.80%,相比基线模型提升了 1.21%和1.3%.
命名实体识别、知识图谱增强、注意力机制、深度学习
50
TP391(计算技术、计算机技术)
2023-09-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
102-107