10.11896/j.issn.1002-137X.2018.01.010
结合词向量和Bootstrapping的领域实体上下位关系获取与组织
实体上下位关系是构建领域知识图谱不可或缺的一种重要的语义关系,传统抽取上下位关系的方法大多不考虑关系的组织.提出一种结合词向量和Bootstrapping的方法来实现领域实体上下位关系的获取与组织.首先,选取旅游领域的种子语料集;然后,采用基于词向量的相似度计算方法对种子集中包含的上下位关系模式进行聚类,筛选出置信度高的模式并对未标注语料进行上下位关系识别,得到候选关系实例,同时选择置信度高的关系实例加入到种子集中,进行下一轮的迭代,直到得到所有的关系实例;最后,根据领域实体上下位关系对的向量偏移并结合领域实体层级关系的特点,采用映射的学习方法进行领域实体层级关系组织.实验结果表明,与传统的方法相比,所提方法的F值提高了近10%.
上下位关系、关系抽取、Bootstrapping方法、词向量、映射学习、层级关系组织
45
TP393(计算技术、计算机技术)
国家自然科学基金61562052,61363044,61472168
2018-04-04(万方平台首次上网日期,不代表论文的发表时间)
共6页
67-72