10.16509/j.georeview.2023.01.085
区域地质调查文本中文命名实体识别
作为我国地质调查领域最重要的数据源之一,地质调查报告中蕴含着丰富的地学知识及地质体描述等关键信息,准确高质量地抽取地质命名实体为地学知识图谱构建、知识推理及知识演化提供基础.笔者等在阐述地质命名实体识别任务基础上,分析地质实体不仅包含大量专业术语,还存在实体嵌套、大量长实体等领域特性,进一步增加了地质命名实体识别难度.笔者等提出一种基于轻量级预训练模型(ALBERT)-双向长短时记忆网络(BiLSTM)-条件随机场(CRF)模型的地质命名实体识别方法.首先利用ALBERT对输入字符上下文特征进行建模,并采用BiLSTM对其进行进一步上下文特征表征,最后采用CRF实现标注序列预测.实验结果表明,在构建的…展开v
地质命名实体识别、轻量级预训练模型、ALBERT、知识图谱、地质报告
69
TP391.1;P62;P56
2023-08-11(万方平台首次上网日期,不代表论文的发表时间)
共11页
1423-1433