期刊专题

10.11925/infotech.2096-3467.2020.0167

基于BiLSTM-CRF中文临床文本中受保护的健康信息识别

引用
[目的]为保护临床文本中的隐私信息,有效地从非结构化文本中识别受保护的健康信息(PHI),提出利用BiLSTM-CRF模型从临床记录中删除隐私信息的自动化方案.[方法]选择一家区域卫生信息平台电子健康档案中的出院小结作为实验数据,根据《健康保险可携性与责任法案》(HIPAA)所规定的18项PHI结合实验数据特征确定7个PHI类别及其下包含的15个PHI类型.基于BiLSTM-CRF模型有效地从非结构化的临床记录中识别受保护的健康信息.[结果]对所有实体类别识别的准确率、召回率以及F值分别达98.66%、99.36%以及99.01%,并对识别错误的标签进行总结分析.[局限]结合语料特征对模型性能的优化有待完善,并且对于自动识别PHI后的临床文本质量未进行评估.[结论]BiLSTM-CRF模型在不需要特征工程的情况下实现了命名实体自动化识别,有利于促进临床信息共享与利用.

中文临床文本、受保护的健康信息、长短期记忆网络、隐私信息、命名实体识别

4

TP391(计算技术、计算机技术)

本文系四川省科技计划项目重点研发基金项目“海量健康数据信息挖掘脱敏技术研究及应用”项目编号:2018GZ0201

2021-02-25(万方平台首次上网日期,不代表论文的发表时间)

共10页

124-133

暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

4

2020,4(10)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn