10.3778/j.issn.1002-8331.2304-0398
中文命名实体识别研究综述
命名实体识别(named entity recognition,NER)是自然语言处理中最基本的任务之一,其主要内容是识别自然语言文本中具有特定意义的实体类型和边界.然而,中文命名实体识别(Chinese named entity recognition,CNER)的数据样本存在词边界模糊、语义多样化、形态特征模糊以及中文语料库内容较少等问题,导致中文命名实体识别性能难以大幅提升.介绍了CNER的数据集、标注方案和评价指标.按照CNER的研究进程,将CNER方法分为基于规则的方法、基于统计的方法和基于深度学习的方法三类,并对近五年来基于深度学习的CNER主要模型进行总结.探讨CNER的研究趋势,为新方法的提出和未来研究方向提供一定参考.
自然语言处理、中文命名实体识别、深度学习、预训练模型、机器学习
60
TP391(计算技术、计算机技术)
新疆维吾尔自治区自然科学基金;新疆维吾尔自治区自然科学基金;新疆维吾尔自治区科技厅国际合作项目;新疆维吾尔自治区科技计划;国家部委重大专项;国家自然科学基金;国家自然科学基金
2024-01-18(万方平台首次上网日期,不代表论文的发表时间)
共13页
15-27