10.3969/j.issn.2095-2163.2020.06.073
基于图分类的中文长文本匹配算法
判断一对文章之间的关系是一项很重要的自然语言处理任务,在新闻系统和搜索引擎等实际服务中有着广泛的应用.然而,相比在信息检索场景中去匹配一对句子或者匹配一个查询-文档对而言,长文章通常具有丰富的语义信息和复杂的逻辑结构,这也使得长文章之间的匹配成为一个相对独立且很有挑战的任务.本文围绕长文章匹配的难点,提出了基于图分类框架的长文本匹配算法,通过将长文本匹配任务等价的转化为图分类任务,使用图表示学习的范式来求解,从而获得长文本匹配的结果.算法模型主要包括基于图表示学习来实现对长文本的建模,基于图注意力神经网络的图节点特征提取,以及图池化等步骤.在两个大型公开数据集上的训练和测试实验结果表明:本文提出的算法可以实现高质量的文本匹配,同时各项评价指标均达到了目前最先进的结果.
自然语言处理、文本匹配、图注意力神经网络、图池化
10
TP391(计算技术、计算机技术)
国家自然科学基金;国家重点研究;发展计划;中国黑龙江省杰出青年科学基金;国家机器人与系统国家重点实验室项目;中兴通讯产学研合作论坛合作项目
2020-11-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
294-299