10.11896/j.issn.1002-137X.2018.01.024
基于分类的中文文本摘要方法
自动文本摘要是自然语言处理领域中一项重要的研究内容,根据实现方式的不同其分为摘录式和理解式,其中理解式文摘是基于不同的形式对原始文档的中心内容和概念的重新表示,生成的文摘中的词语无需与原始文档相同.提出了一种基于分类的理解式文摘模型.该模型将基于递归神经网络的编码-解码结构与分类结构相结合,并充分利用监督信息,从而获得更多的摘要特性;通过在编码-解码结构中使用注意力机制,模型能更精确地获取原文的中心内容.模型的两部分可以同时在大数据集下进行训练优化,训练过程简单且有效.所提模型表现出了优异的自动摘要性能.
递归神经网络、注意力机制、文本摘要、文本分类
45
TP391(计算技术、计算机技术)
2018-04-04(万方平台首次上网日期,不代表论文的发表时间)
共5页
144-147,178