10.16353/j.cnki.1000-7490.2021.10.003
融合HowNet的中文电子病历命名实体识别
中文电子病历中存在大量非结构化的文本信息,其中的医学命名实体识别是生物医学领域知识组织和服务的基础.文章首先分析了中文电子病历特征的词语、词性、语素和词的组成等语法特征,以及HowNet语义特征;然后,运用CRF模型,提出了基于CRF医学命名实体的识别方案;最后,实验表明融合HowNet的中文电子病历命名实体识别方法具有较好的效果.
中文电子病历;医学命名实体;命名实体识别;HowNet
44
本文为国家社会科学基金一般项目"基于语义网的医疗健康信息组织与服务模式研究";国家社会科学基金重点项目"大数据环境下领域知识加工与组织模式研究";四川省高校人文社会科学重点研究基地——四川学术成果分析与应用研究中心重点项目"健康数据的知识库构建及服务模式研究"
2021-11-08(万方平台首次上网日期,不代表论文的发表时间)
共9页
18-26