基于关联记忆网络的中文细粒度命名实体识别
细粒度命名实体识别是对文本中的实体进行定位,并将其分类至预定义的细粒度类别中.目前,中文细粒度命名实体识别仅使用预训练语言模型对句子中的字符进行上下文编码,并没有考虑到类别的标签信息具有区分实体类别的能力.由于预测句子不带有实体标签,使用关联记忆网络来捕获训练集句子的实体标签信息,并将标签信息融入预测句子的字符表示中.该方法将训练集中带实体标签的句子作为记忆单元,利用预训练语言模型获取原句子和记忆单元句子的上下文表示,再通过注意力机制将记忆单元句子的标签信息与原句子的表示结合,从而提升识别效果.在CLUENER 2020中文细粒度命名实体识别任务上,该方法对比基线方法获得了提升.
中文细粒度命名实体识别;关联记忆网络;多头自注意力;预训练语言模型
32
TP18(自动化基础理论)
国家自然科学基金;四川省新一代人工智能重大专项;四川省重点研发项目
2021-08-31(万方平台首次上网日期,不代表论文的发表时间)
共12页
2545-2556