10.3778/j.issn.1002-8331.2101-0465
基于特征增强的开放域知识库问答系统
实体消歧和谓词匹配是中文知识库问答系统(CKBQA)中的两个核心任务.针对开放域知识库中实体和谓词数量巨大,且中文问句与知识库知识在表现形式上存在差异的问题,提出一种基于特征增强的B E RT的流水线式问答系统(BERT-CKBQA),改进了上述两个子任务.采用BERT-CRF模型识别问句中提及的实体,得到候选实体集合.将问题和拼接谓词特征的候选实体输入BERT-CNN模型进行实体消歧.根据实体生成候选谓词集合,提出通过注意力机制引入答案实体谓词特征的BERT-BiLSTM-CNN模型进行谓词匹配.结合实体和谓词的得分确定查询路径来检索最终答案.该方法设计了一个中文简单问题的开放域知识库问答系统,引入预训练模型与谓词特征增强子任务特征以提升其性能,并在NLPCC-ICCPOL-2016KBQA数据集上取得了88.75%的平均F1值,提高了系统的回答准确率.
开放域知识库问答、实体提及识别、实体消歧、谓词匹配、BERT、特征增强
58
TP391(计算技术、计算机技术)
国家重点研发计划2016YFC0901902
2022-09-15(万方平台首次上网日期,不代表论文的发表时间)
共7页
206-212