期刊专题

10.11925/infotech.2096-3467.2022.0908

面向中文医学文本命名实体识别的神经网络模块分解分析

引用
[目的]对基于神经网络的中文医学文本命名实体识别模型进行分解,研究符号表示层和上下文编码层中基础神经网络模块功能以及多神经网络模块协同组合对实体识别性能的影响.[方法]基于CCKS2017、CCKS2019和IMCS-NER等中文医学文本命名实体识别任务发布的基准语料,对比分析神经网络模型的符号表示层和上下文编码层采用不同神经网络模块时的性能差异.以此为基础,分别构建将多神经网络模块集成、并联、串联的实体识别模型,比较并分析其性能差异.[结果]符号表示层使用hfl/chinese-macbert-base、hfl/chinese-roberta-wwm-ext、hfl/chinese-bert-wwm-ext等预训练语言模型能显著提高识别性能,平均Fl值分别达到0.881 6、0.881 6、0.881 2;在上下文编码层融合神经网络模块能够提高识别性能.其中,基于集成的神经网络性能最优,Fl值分别达到0.933 0、0.8211、0.918 1.[局限]实验仅基于中文医学文本语料,所得结论有待在其他语种的语料上进行验证.[结论]基础神经网络模块的类型和多神经网络模块的协同方式显著影响神经网络在中文医学文本命名实体识别任务上的表现.

命名实体识别、神经网络、模块分解、中文医学文本

7

TP391(计算技术、计算机技术)

国家社会科学基金20BTQ092

2023-05-12(万方平台首次上网日期,不代表论文的发表时间)

共12页

26-37

暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

7

2023,7(2)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn