融合词嵌入表示特征的实体关系抽取方法研究
[目的]为解决已有方法中单词特征表示不具有语义信息这一问题,对词嵌入表示特征在关系抽取中的作用进行探讨.[方法]考虑词嵌入表示级别、词汇级别和语法级别三种类型特征,利用朴素贝叶斯模型、决策树模型和随机森林模型进行对比实验,并选出代表全部特征的有效特征子集.[结果]使用全部特征时,决策树算法的准确率达到0.48,关系抽取效果最佳,Member-Collection(E2,E1)类型关系的F1值达到0.70,特征排序结果表明依存关系有助于关系抽取.[局限]对小样本量和情况复杂的关系类型识别效果有待提高,以及词向量训练及方法的相关参数需要进一步优化.[结论]实验证明选取的三种类型特征的有效性,词嵌入表示级别特征在实体关系抽取问题中可以发挥重要作用.
关系抽取、词嵌入表示、Word2Vec
1
TP393(计算技术、计算机技术)
ISTIC-EBSCO文献大数据发现服务联合实验室基金项目“基于clique子团聚类的文本主题识别方法研究”的研究成果之一
2017-11-09(万方平台首次上网日期,不代表论文的发表时间)
共8页
8-15