10.3772/j.issn.1002-0470.2015.02.005
中文电子病历命名实体标注语料库构建
针对中文电子病历命名实体语料标注空白的现状,研究了中文电子病历命名实体标注语料库的构建.参考2010年美国国家集成生物与临床信息学研究中心(I2B2)给出的电子病历命名实体类型及修饰类型的定义,在专业医生的指导下制定了详尽的中文电子病历标注规范;通过对大量中文电子病历的分析,提出了一套完整的中文电子病历命名实体标注方案,而且采用预标注和正式标注的方法,建立了一定规模的中文电子病历命名实体标注语料库,其标注语料的一致性达到了92%以上.该工作对中文电子病历的命名实体识别及信息抽取研究提供了可靠的数据支持,对医疗知识挖掘也有重要意义.
中文电子病历(CEMR)、命名实体、标注语料库、标注规范、标注一致性(IAA)
25
TP3;H08
国家自然科学基金60975077
2015-07-31(万方平台首次上网日期,不代表论文的发表时间)
共8页
143-150