期刊专题

10.11925/infotech.2096-3467.2017.1053

高维电子病历的数据降维策略与实证研究

引用
[目的]以高维的结构化电子病历数据为研究对象,探究数据降维的策略,为电子病历知识发现提供参考.[方法]通过文献调研进行初步约简,再分别利用主成分分析法提取特征根大于1的因子、提取累计贡献率大于85%的因子,利用Logistic回归方法提取有显著差异性的因子进行降维;根据实证研究定性定量评价三种方法提取的属性结果.[结果]三种降维方法分别提取8个、17个和14个属性,经过定性和定量评价发现,利用主成分分析方法提取特征根大于1的因子的降维效果相对较好.[局限]数据样本量有限,未能搜集一定时间跨度的数据进行深入分析.[结论]本研究制定的数据降维策略有效,可以在保留目标数据原始特征的同时,对高维空间数据进行识别、定位、分析,用较少的属性特征代替整体数据集,解决电子病历数据维度过高带来的数据挖掘灾难,提高数据挖掘的效率和分析结果的准确性.

降维、数据挖掘、知识发现、电子病历

2

G353.1(情报学、情报工作)

国家自然科学基金面上项目“嵌入式知识服务驱动下的领域多维知识库构建”71573102;吉林省教育厅社会科学项目“虚拟健康社区知识发现与实证研究”项目JJKH20170881SK的研究成果之一

2018-03-29(万方平台首次上网日期,不代表论文的发表时间)

共11页

88-98

暂无封面信息
查看本期封面目录

数据分析与知识发现

1003-3513

11-2856/G2

2

2018,2(1)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn