期刊专题

10.15938/j.jhust.2021.04.013

医疗文本的小样本命名实体识别

引用
针对医疗文本命名实体识别缺乏足够标记数据的问题,提出了一种新的命名实体识别神经网络和数据增强方法.该方法首先利用汉字的拼音和笔画来扩展Bert词向量,使Bert词向量能够包含更多先验知识;接着将命名实体识别模型与分词模型进行联合训练,以增强模型对于实体边界的判别能力;最后采用改进的数据增强方法处理训练数据,能够在避免模型过拟合的同时增加模型对于命名实体的识别效果.在CCKS-2019提供的电子病历文本上的实验结果表明,所提出的方法在小样本情况下能有效提高命名实体识别的准确率,在训练数据减少一半的情况下,识别率仍能保持没有明显下降.

命名实体识别、小样本、数据增强、联合训练、特征融合

26

TP391.1(计算技术、计算机技术)

国家自然科学基金面上项目;黑龙江省自然科学基金杰出青年项目;哈尔滨市杰出青年人才基金;黑龙江省自然科学基金面上项目;黑龙江省普通本科高等学校青年创新人才项目;黑龙江省教育厅科学技术研究项目;哈尔滨理工大学青年拔尖创新人才;中国博士后基金

2021-09-22(万方平台首次上网日期,不代表论文的发表时间)

共8页

94-101

暂无封面信息
查看本期封面目录

哈尔滨理工大学学报

1007-2683

23-1404/N

26

2021,26(4)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn