DOI：10.3969/j.issn.1002-137X.2008.03.043

本体驱动的文本虚拟样本构造方法研究

引用

摘要：

构造虚拟样本能够为机器学习中的训练集融入先验知识,从而改善标注瓶颈问题.提出了一种本体驱动的文本虚拟样本构造方法.在确保类别不变性的前提下,该方法依据领域相关本体所明晰表达的领域知识,基于本体树的点、边、子树,从同义、父子、语义同构的多个词义关系角度实现了文本虚拟样本的构造.初步实验表明,该方法与原分类及类似方法相比具有更好的分类精度和推广能力.

关键词：虚拟样本、文本分类、本体、本体树、领域知识

所属期刊栏目：35

分类号：TP3(计算技术、计算机技术)

资助基金：国家自然科学基金60675015

在线出版日期：2008-05-29（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：142-145

英文信息展示

期刊专题