基于XLnet语言模型的中文命名实体识别

引用

摘要：

语言模型的建立对挖掘句子内部语义信息有着直接的影响,为了提高中文命名实体识别率,字的语义表示是关键所在.针对传统的中文命名实体识别算法没有充分挖掘到句子内部的隐藏信息问题,该文利用LSTM提取经过大规模语料预训练生成的字向量特征,同时将词向量预测矩阵传入到字向量特征提取阶段,通过矩阵运算融合为词向量特征,并进一步利用CNN提取词语之间的空间信息,将其与得到的词向量特征整合到一起输入语言模型XLnet(Generalized autoregressive pretraining for language understanding)中,然后经过BiGRU-CRF输出最优标签序列,提出了CAW-XLnet-BiGRU-CRF网络框架.并与其他的语言模型作了对比分析,实验结果表明,该框架解决了挖掘内部隐藏信息不充分问题,在《人民日报》1998年1月份数据集上的F1值达到了95.73％,能够较好地应用于中文命名实体识别任务.

关键词：命名实体识别;词向量;XLnet;语言模型

所属期刊栏目：57

分类号：TP391.1(计算技术、计算机技术)

资助基金：山西省基础研究项目自然科学基金;太原理工大学科技创新基金

在线出版日期：2021-09-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：156-162

英文信息展示

期刊专题