10.3969/j.issn.1671-1815.2022.10.024
建筑安全事故通告关键信息自动提取方法
在建筑工程项目中,高效地对施工安全进行管理是十分重要的.工程安全事故通告记录了实际施工过程中发生事故的相关信息.但是从业人员对这种非结构化文本进行总结和分析是比较困难的.随着自然语言过程(natural language process,NLP)技术的快速发展,为了有效地对这一类文本进行处理,学者们已经取得了一些不错的成果.但是现阶段的一个关键问题是深度神经网络的训练需要大规模的训练数据集.并且建筑工程行业中数据来源非常有限,所以数据集对建筑工程行业来说是一个巨大的挑战.现提出一个基于自然语言处理的小样本训练方法.首先通过一种基于交叉组合的文本数据增广算法扩大数据集,然后以"字符"为检测单元进行汉字语义编码,使用BiLSTM-CRF模型作为检测核心对文本进行处理.最后,以安全事故通告为对象进行分析处理,为施工的安全管理提供了理论指导.
自动信息提取、工程管理、小样本训练、数据增广、建筑事故通告
22
TP391.1(计算技术、计算机技术)
中铁七局集团有限公司自主研发项目K19-76200-047
2022-05-05(万方平台首次上网日期,不代表论文的发表时间)
共7页
4026-4032