10.3969/j.issn.1000-9825.2020.12.007
中文文本蕴含类型及语块识别方法研究
文本蕴含识别(RTE)是判断两个句子语义是否具有蕴含关系的任务.近年来英文蕴含识别研究取得了较大发展,但主要是以类型判断为主,在数据中精确定位蕴含语块的研究比较少,蕴含类型识别的解释性较低.从中文文本蕴含识别(CNLI)数据中挑选12 000个中文蕴含句对,人工标注引起蕴含现象的语块,结合语块的语言学特征分析归纳了7种具体的蕴含类型.在此基础上,将中文蕴含识别任务转化为7分类的蕴含类型识别和蕴含语块边界-类型识别任务,在深度学习模型上达到69.19%和62.09%的准确率.实验结果表明,所提出的方法可以有效发现中文蕴含语块边界及与之对应的蕴含类型,为下一步研究提供了可靠的基准方法.
文本蕴含识别、语块识别、蕴含类型、深度学习
31
TP18(自动化基础理论)
国家重点研发计划2018YFB1005105
2021-03-03(万方平台首次上网日期,不代表论文的发表时间)
共15页
3772-3786