期刊专题

10.13266/j.issn.0252-3116.2023.02.013

基于UniLM模型的学术文摘观点自动生成研究

引用
[目的/意义]将海量学术文本观点提取工作由人工转向机器,提高效率的同时又能够保证观点提取的准确性、客观性.[方法/过程]使用UniLM统一语言预训练模型,训练过程中对模型进行精调,以人工标注数据集进行机器学习.将学术文摘作为长度为a的文本序列,经过机器学习,生成长度为b的句子序列(a≥b),并且作为学术论文观点句输出.[结果/结论]研究结果表明:UniLM模型对于规范型文摘、半规范型文摘、非规范型文摘观点生成精准度分别为94.36%、77.27%、57.43%,规范型文摘生成效果最好.将机器学习模型应用于长文本观点生成,为学术论文观点生成提供一种新方法.不足之处在于本文模型依赖文摘的结构性,对非规范型文摘观点生成效果有所欠缺.

学术文摘、观点自动生成、UniLM模型、机器学习

67

TP391;G250(计算技术、计算机技术)

教育部人文社会科学研究项目;中央高校基本科研业务费资助项目

2023-03-24(万方平台首次上网日期,不代表论文的发表时间)

共9页

131-139

相关文献
评论
暂无封面信息
查看本期封面目录

图书情报工作

0252-3116

11-1541/G2

67

2023,67(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn