期刊专题

10.7544/issn1000-1239.2018.20160893

基于生物医学文献的化学物质致病关系抽取

引用
化学物质和疾病之间的副作用关系使得化学物质-疾病关系受到更多关注.介绍一个从生物医学文献中抽取化学物质致病关系的系统——CDRExtractor.该系统首先训练一个句子级别分类器,用于抽取存在于同一个句子中的化学物质致病(chemical-induced disease,CID)关系.在句子级别分类器训练阶段,将特征核和图核特征看作2个独立的视图,采用基于半监督的Co-training方法,利用少量人工标注的训练集和大量未标注语料训练模型.之后,CDRExtractor利用文档级别的化学物质与疾病信息特征训练一个文档级别的分类器用于实现文档级别跨句子的CID关系抽取.最后,利用规则将2个分类器的抽取结果进行整合,生成最终的输出结果.实验结果表明:CDRExtractor在BioCreative VCDR评测任务CID子任务提供的测试集上F值达到67.72%.

信息抽取、文本挖掘、半监督学习、Co-training算法、化学物质-疾病关系

55

TP391(计算技术、计算机技术)

国家自然科学基金项目61272373,61340020,61572102,61572098;新世纪优秀人才支持计划基金项目NCET-13-0084;中央高校基本科研业务费专项资金项目DUT14YQ213This work was supported by the National Natural Science Foundation of China61272373,61340020,61572102,61572098;the New Century Excellent Talents Supporting PlanNCET-13-0084;the Fundamental Research Funds for the Central UniversitiesDUT14YQ213

2018-02-06(万方平台首次上网日期,不代表论文的发表时间)

共9页

198-206

暂无封面信息
查看本期封面目录

计算机研究与发展

1000-1239

11-1777/TP

55

2018,55(1)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn