10.3969/j.issn.1006-2475.2017.12.017
基于半监督协同训练的百科知识库实体对齐
针对传统实体对齐方法中的有监督学习算法依赖大量标注数据,以及特征表示不适用于百科知识库等问题,提出一种基于半监督协同训练的实体对齐方法.将实体对齐建模为一个带约束的二分类问题,充分利用实体名、属性、描述文本及其中的时间、数值等关键信息,组合生成多维特征;将特征划分为2个相对独立的视图,通过2个视图上分类器的协同训练,迭代地从未标注数据中学习同义实体的分布情况.在2个中文百科上的实验结果表明,使用半监督协同训练方法进行实体对齐的F1值达到84.3%,较其他方法效果最优,证明了其有效性和在百科知识库上的实用价值.
实体对齐、半监督、协同训练、特征表示、梯度提升决策树
TP391.1(计算技术、计算机技术)
国家高技术研究发展计划项目2015AA7115028,2015AA7115061
2018-01-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
88-93