基于分割注意力与边界感知的中文嵌套命名实体识别算法
由于中文文本缺少天然分隔符,中文嵌套命名实体识别(Chinese Nested Named Entity Recognition,CNNER)任务极具挑战性,而嵌套结构的复杂性和多变性更增添了任务的难度.文中针对CNNER任务提出了一种新型边界感知层叠神经网络模型(Boundary-aware Layered Nerual Model,BLNM).首先通过构建了一个分割注意力网络来捕获潜在的分词信息和相邻字符之间的语义关系,以增强字符表示;然后通过动态堆叠扁平命名实体识别层的网络,由小粒度到大粒度逐层识别嵌套实体;最后为了利用被预测实体的边界信息和位置信息,构建了一个边界生成式模块,用于连接相邻的扁平命名实体识别层以及缓解错误传递问题.基于ACE 2005中文嵌套命名实体数据集的实验结果表明,该模型具有较好的性能.
中文嵌套命名实体识别、分割注意力、边界生成式、层叠神经网络
50
TP391.1(计算技术、计算机技术)
国家自然科学基金62172167
2023-02-07(万方平台首次上网日期,不代表论文的发表时间)
共8页
213-220