10.3969/j.issn.1006-2475.2020.11.010
基于CNN-BGRU-CRF的中文电子病历实体抽取方法
针对传统方法在中文电子病历实体抽取任务中存在对词典和分词工具过于依赖,无法充分利用上下文特征等问题,本文提出一种基于字嵌入卷积(CNN)、双向门控循环单元(BGRU)和条件随机场(CRF)结合的中文电子病历实体抽取模型.首先利用字嵌入方法提取出潜在词特征,然后在使用字词特征联合方式的同时使用注意力机制突出特定的信息,最后通过合理性约束得到最终结果.该模型充分使用了字词特征避免了实体抽取受错误分词的影响,并且减少了人工构造特征的过程,提高了实体抽取效率.实验结果表明,该模型在诊断名称、症状名称、治疗方式类别的实体抽取中,F值表现优于传统的Bi-LSTM-CRF模型.
中文电子病历、实体抽取、卷积网络、双向门控循环单元、注意力机制
TP181(自动化基础理论)
国家自然科学基金资助项目;山东省重点研发计划项目
2020-12-04(万方平台首次上网日期,不代表论文的发表时间)
共6页
60-64,99