10.3969/j.issn.1673-7571.2022.11.008
正则表达式在提取冠状动脉CTA和钙化积分报告结构化信息中的应用
目的:初步探索正则表达式对冠脉CTA和钙化积分影像报告结构化信息提取的可行性和准确性.方法:首先由具有丰富心血管CT诊断经验的医师根据冠状动脉疾病报告与数据系统(CAD-RADS)专家共识确定需提取的特征标签和特征值.然后随机抽取我科2019年8月后使用CAD-RADS系统规范化的100份冠脉CTA及钙化积分报告作为训练集,通过遍历训练集报告的结构和特点,总结与特征值对应的特征条件,并利用特征条件和正则表达式制定分析方案.最后分别抽取200份经CAD-RADS系统规范化的报告及200份未经CAD-RADS系统规范化的报告作为验证集1和验证集2,利用上述分析方案对验证集1和验证集2进行结构化信息提取,并以同时期由心血管诊断医师人工结构化的报告为金标准,评价分析方案的效果和可移植性.结果:验证集1中,斑块类型的召回率和准确率较低,分别为86.0%和88.3%,其余指标的召回率和准确率均达到95%以上.验证集2除支架检查外,其余指标的召回率均低于验证集1,回旋支钙化积分以及壁冠状动脉的召回率在40%左右,但准确性仍保持在较高水平,为83.9%~100.0%.结论:利用正则表达式对经CAD-RADS规范化的冠脉CTA及钙化积分影像报告进行结构化信息提取是可行的,可以快速、有效地提取到遵循CAD-RADS系统报告的结构化信息,且成本低,但其可移植性具有一定的限制.
正则表达式、自然语言处理、结构化报告、冠脉CTA、钙化积分
17
R319;R197.3(医用一般科学)
2023-02-20(万方平台首次上网日期,不代表论文的发表时间)
共7页
38-44