朴素贝叶斯算法与Bootstrapping方法相结合的中文物种描述文本语义标注研究
[目的]降低中文物种描述文本语义标注的学习成本.[方法]设计基于Bootstrapping的弱监督学习方法,以少量数据为基础,迭代执行学习和标注过程.在迭代过程中,利用置信度最高的标注数据扩充知识库,提升标注能力.[结果]运用15 041条数据测试算法效率,F-value的平均值达到0.911 2.[局限]对过于稀疏的数据,标注效率相对较低.[结论]本研究设计的方法不仅有效降低系统学习对训练数据规模的要求,而且可提高标注效率.
Bootstrapping方法、朴素贝叶斯、物种描述文本、语义标注
TP391(计算技术、计算机技术)
2014-06-30(万方平台首次上网日期,不代表论文的发表时间)
83-89