10.3969/j.issn.1002-137X.2008.03.043
本体驱动的文本虚拟样本构造方法研究
构造虚拟样本能够为机器学习中的训练集融入先验知识,从而改善标注瓶颈问题.提出了一种本体驱动的文本虚拟样本构造方法.在确保类别不变性的前提下,该方法依据领域相关本体所明晰表达的领域知识,基于本体树的点、边、子树,从同义、父子、语义同构的多个词义关系角度实现了文本虚拟样本的构造.初步实验表明,该方法与原分类及类似方法相比具有更好的分类精度和推广能力.
虚拟样本、文本分类、本体、本体树、领域知识
35
TP3(计算技术、计算机技术)
国家自然科学基金60675015
2008-05-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
142-145