10.13266/j.issn.0252-3116.2023.02.013
基于UniLM模型的学术文摘观点自动生成研究
[目的/意义]将海量学术文本观点提取工作由人工转向机器,提高效率的同时又能够保证观点提取的准确性、客观性.[方法/过程]使用UniLM统一语言预训练模型,训练过程中对模型进行精调,以人工标注数据集进行机器学习.将学术文摘作为长度为a的文本序列,经过机器学习,生成长度为b的句子序列(a≥b),并且作为学术论文观点句输出.[结果/结论]研究结果表明:UniLM模型对于规范型文摘、半规范型文摘、非规范型文摘观点生成精准度分别为94.36%、77.27%、57.43%,规范型文摘生成效果最好.将机器学习模型应用于长文本观点生成,为学术论文观点生成提供一种新方法.不足之处在于本文模型依赖文摘的结构性,对非规范型文摘观点生成效果有所欠缺.
学术文摘、观点自动生成、UniLM模型、机器学习
67
TP391;G250(计算技术、计算机技术)
教育部人文社会科学研究项目;中央高校基本科研业务费资助项目
2023-03-24(万方平台首次上网日期,不代表论文的发表时间)
共9页
131-139