10.3969/j.issn.1002-3674.2022.01.003
采用多阅片者多病例设计评估AI辅助医疗产品临床试验的样本量估算和应用
目的 探索基于多阅片者多病例研究设计的人工智能辅助医疗器械或软件进行确证性临床试验的病例和阅片者样本量的选择依据和方法.方法 以某三甲医院收集的某胸部CT影像辅助诊断系统用于肺结节诊断的试验数据为例,采用R软件对数据进行方差分析和诊断准确度统计,以方差和协方差分析的结果为依据对计划开展的正式试验样本量进行估算,同时探索分析不同参数组合条件下的样本量变化情况.结果 7名具有不同胸部CT阅片经验的影像科医生对回顾性纳入的200例病例影像分别在AI辅助条件和无AI辅助条件下进行读片,采用AI辅助医生读片的诊断准确性优于医生独立读片的准确性[AF-ROC差值0.119(95%CI:0.078,0.161),P<0.001],不同阅片者提高的准确度水平不同.同一阅片者分别在两种诊断模式下诊断结果的相关系数越大,需要病例样本量越小;相同阅片模式下不同阅片者间诊断结果的相关系数和不同阅片者在不同诊断模式间诊断结果的相关系数的差值越大,需要的病例样本量越大.结论 基于多阅片者多病例研究设计的人工智能或机器学习辅助医疗类的器械或软件的确证性临床试验中采用多阅片者会适当减低病例的样本量,采用合适的统计学方法可以对阅片者和病例的样本量进行科学的估算.
多阅片者多病例;人工智能辅助;病例;样本量
39
R195.1(保健组织与事业(卫生事业管理))
国家重点研发计划;老龄化科技应对重点专项
2022-03-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
14-18