10.13232/j.cnki.jnju.2023.04.009
融入领域知识的跨境民族文化生成式摘要方法
从跨境民族文化文本中生成具有领域知识的摘要对进一步开展跨境民族文化文本检索、问答等任务具有重要的支撑作用,当前基于深度学习的生成式文本摘要取得了较好的效果,但直接用于跨境民族文化文本摘要任务会导致生成的摘要出现领域词汇丢失的问题.为此,提出一种融入领域知识的跨境民族文化生成式摘要方法(Domain Knowledge-Culture-Generative Summary,DKCGS),在编码端将跨境民族文化领域词典编码与原文本编码融合,以此增强模型对领域词汇的表征能力;在解码端,基于指针生成网络将具有同义或跨境关系的领域词汇分布与原文本分布结合,提高模型生成文化领域词汇的准确率.同时,在通用领域文本上进行预训练并进一步初始化参数,以缓解数据稀缺导致模型训练效果不佳的问题.实验结果表明,提出的方法在跨境民族文本摘要数据集上比基线模型的Rouge-1提升了 0.95,有效提升了跨境民族文化文本摘要生成的质量.
跨境民族文化、领域知识、指针生成网络、预训练、文本摘要
59
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;云南省重大科技专项计划;云南省重大科技专项计划;云南省自然科学基金重点项目
2023-11-02(万方平台首次上网日期,不代表论文的发表时间)
共9页
620-628