10.13998/j.cnki.issn1002-1248.21-0262
基于Bi-LSTM的古籍事件句触发词分类方法研究
[目的/意义]开展面向数字人文的古籍触发动词识别及分类研究,对于古籍文本的深层次挖掘和内容揭示具有重大的意义.本文利用深度学习分类算法,探索依据古籍触发词进行事件句文本多元分类的自动化方法.[方法/过程]在构建了典籍事件触发词分类体系和触发词典的基础上,选取4个不同类别的事件句文本作为实验数据,利用Onehot和Tokenizer对类别标签和句子文本进行分别编码后,输入Bi-LSTM模型中训练分类器,并通过调整参数设置了对比实验,采取通用的评价指标分析了分类器的性能.[结果/结论]经过多次训练和调整之后得到的分类器,在测试集的评估中精确度达到了0.95,证明基于深度学习的实验方法和构建的触发词数据集能够有效的帮助我们实现古籍事件句文本的自动化多元分类.
触发词分类;Bi-LSTM模型;多元分类;《左传》
33
G350(情报学、情报工作)
国家社科基金项目"基于典籍的中华传统文化知识表达体系自动构建方法研究"18BTQ063
2021-10-14(万方平台首次上网日期,不代表论文的发表时间)
共10页
27-36