10.3772/j.issn.2095-915x.2020.04.004
面向少量标注数据的命名实体识别研究
作为语义知识库、知识图谱的基本组件,命名实体识别对智能系统建设和科技情报服务都起到重要作用.近年来,深度学习方法在特征抽取深度和模型精度上表现优异,已经超过了传统方法,但无论是传统机器学习还是深度学习方法都依赖大量标注数据来训练模型,而现有的研究对少量标注数据学习问题探讨较少.鉴于此,本文全面总结了少量标注数据命名实体识别方法.具体地,按照数据、模型、特征、知识的学习逻辑区分为4类:基于数据增强、模型迁移、特征变换、知识链接的方法,并对这些方法进行分析和比较.此外,我们整合了数据资源以及典型方法评测,最后对未来可能的发展方向进行预测.
命名实体识别、深度学习、迁移学习、科技情报
6
G35(情报学、情报工作)
中国博士后科学基金第65批面上项目"流形正则化自编码政策文本表示及主题词抽取方法研究"2019M650804
2020-10-20(万方平台首次上网日期,不代表论文的发表时间)
共14页
37-50