DOI：10.13266/j.issn.0252-3116.2023.02.013

基于UniLM模型的学术文摘观点自动生成研究

引用

摘要：

[目的/意义]将海量学术文本观点提取工作由人工转向机器,提高效率的同时又能够保证观点提取的准确性、客观性.[方法/过程]使用UniLM统一语言预训练模型,训练过程中对模型进行精调,以人工标注数据集进行机器学习.将学术文摘作为长度为a的文本序列,经过机器学习,生成长度为b的句子序列(a≥b),并且作为学术论文观点句输出.[结果/结论]研究结果表明:UniLM模型对于规范型文摘、半规范型文摘、非规范型文摘观点生成精准度分别为94.36％、77.27％、57.43％,规范型文摘生成效果最好.将机器学习模型应用于长文本观点生成,为学术论文观点生成提供一种新方法.不足之处在于本文模型依赖文摘的结构性,对非规范型文摘观点生成效果有所欠缺.

关键词：学术文摘、观点自动生成、UniLM模型、机器学习

所属期刊栏目：67

分类号：TP391;G250(计算技术、计算机技术)

资助基金：教育部人文社会科学研究项目;中央高校基本科研业务费资助项目

在线出版日期：2023-03-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：131-139

英文信息展示

期刊专题