10.11925/infotech.2096-3467.2019.0147
基于机器学习的在线问诊平台智能分诊研究
[目的]比较不同机器学习算法在智能分诊任务中的准确率,针对性地分析在线问诊平台的类目设置问题,尝试从数据中提取新特征提升分类器效果.[方法]基于“春雨医生”13个科室33 073条实际问诊数据,比较两种文本向量化方式在支持向量机、多项式贝叶斯、Logistic回归、随机森林、k近邻以及集成分类模型这6种分类器上实现智能分诊的准确率;通过高频词分析及词语共现对不同科室的错分数据进一步分析.[结果]文本向量化方法为TF-IDF、分类算法为支持向量机的分类器在智能分诊中的总体效果最优,增加年龄和性别特征后分类准确率可达76.3%.该分类器对外科数据分诊准确率仅为40.9%,原因在于问诊平台类目设置的混淆.[局限]假设现有数据中患者选择的科室是正确的.[结论]机器学习可用于在线问诊平台的智能分诊任务,根据医疗数据特点增加输入特征是分类器提高准确率的一个方向.部分疾病及症状的跨科室性影响了分类器的效果,在线问诊平台可通过推荐多个科室的方式来提升患者问诊体验.
在线问诊、智能分诊、机器学习、支持向量机
3
TP393;G35(计算技术、计算机技术)
2019-11-18(万方平台首次上网日期,不代表论文的发表时间)
共10页
88-97