期刊专题

10.11925/infotech.2096-3467.2017.1047

基于文本挖掘的药物副作用知识发现研究

引用
[目的]利用文本挖掘方法发现潜在的药物-副作用关系,为完善现有药物-副作用数据库及药物副作用早期预测提供有效途径.[方法]从PubMed数据库获取201 1年-2016年间与人类药物治疗和副作用相关文献共1 00 873篇,对文献集进行Perl语言切分处理、基于词典的命名实体识别、R语言生成药物-副作用共现矩阵、gCLUTO双聚类分析等一系列研究.[结果]以聚类结果中一类为例,计算得到本方法提取药物-副作用的准确率达75.65%,其中发现潜在的药物-副作用关系比例达13.91%.[局限]仅使用基于词典的命名实体识别方法,并未考虑语法、词法等因素,造成较高的假阳性率.[结论]本研究可用于发现数据库中尚无记载的药物副作用,为药物副作用的早期发现提供参考,为进一步运用自动学习的方法更加准确地提取药物-副作用提供可行的方案.

药物副作用、文本挖掘、命名实体识别、聚类分析

2

TP391;G353(计算技术、计算机技术)

2018-06-07(万方平台首次上网日期,不代表论文的发表时间)

共8页

79-86

暂无封面信息
查看本期封面目录

数据分析与知识发现

1003-3513

11-2856/G2

2

2018,2(3)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn