10.3778/j.issn.1002-8331.1505-0282
基于文档集的生物信息挖掘模型研究
针对生物医学文献的数量急剧增长,人工从文献中获取所需要的信息已不能适应生物医学文献数量迅速生长的需要.利用Stanford Parser等开源工具,采用自然语言处理技术、统计学等多种方法,提出了一种新型的生物信息挖掘模型,并对其关键技术进行分析.该模型在对全文文本SBQTL(Soybean Quantitative Trait Loci)测试中父母本信息提取的准确率和召回率分别为93.0%和78.4%;在对PubMed测试中,准确率和召回率分别为94.3%和80.0%.解决了生物医学研究者从海量文献中更有效、快速地找到所需信息的问题,以便生物学家发现隐藏的生物医学知识并验证得到新的科学发现,从而使人们对生物医学现象的认识得到了提高.
文本挖掘、StanfordParser、文本预处理、依存关系、信息抽取
52
TP311(计算技术、计算机技术)
2017-01-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
102-106,188