基于Lattice LSTM的古汉语命名实体识别
基于《四库全书》数据集,研究古汉语的命名实体识别技术.提出了基于Lattice LSTM模型的古汉语命名实体识别算法,该方法将字符序列信息和词序列信息共同作为模型的输入.采用甲言(jiayan)分词工具,利用word2vec训练古文字、词向量并作为Lattice LSTM模型的输入,提升了古汉语命名实体识别的效果.基于Lattice LSTM模型和预训练的古文字、词向量,提高了古汉语的实体识别效果,相比传统的BiLSTM-CRF模型,其F1分数提升3.95%左右.
古汉语、命名实体识别、BiLSTM-CRF、Lattice LSTM、深度学习
47
TP312(计算技术、计算机技术)
国家重点研发计划课题2017YFB1400402
2020-12-03(万方平台首次上网日期,不代表论文的发表时间)
共5页
18-22