10.11925/infotech.2096-3467.2017.1047
基于文本挖掘的药物副作用知识发现研究
[目的]利用文本挖掘方法发现潜在的药物-副作用关系,为完善现有药物-副作用数据库及药物副作用早期预测提供有效途径.[方法]从PubMed数据库获取201 1年-2016年间与人类药物治疗和副作用相关文献共1 00 873篇,对文献集进行Perl语言切分处理、基于词典的命名实体识别、R语言生成药物-副作用共现矩阵、gCLUTO双聚类分析等一系列研究.[结果]以聚类结果中一类为例,计算得到本方法提取药物-副作用的准确率达75.65%,其中发现潜在的药物-副作用关系比例达13.91%.[局限]仅使用基于词典的命名实体识别方法,并未考虑语法、词法等因素,造成较高的假阳性率.[结论]本研究可用于发现数据库中尚无记载的药物副作用,为药物副作用的早期发现提供参考,为进一步运用自动学习的方法更加准确地提取药物-副作用提供可行的方案.
药物副作用、文本挖掘、命名实体识别、聚类分析
2
TP391;G353(计算技术、计算机技术)
2018-06-07(万方平台首次上网日期,不代表论文的发表时间)
共8页
79-86