10.13663/j.cnki.lj.2020.11.014
数字人文下的先秦古汉语关键词抽取应用——以《春秋经传》为例
数字人文作为一门交叉学科,其强调计算技术与人文学科融合发展.古汉语典籍是人文学科研究中重要的一部分,在此背景下,利用计算机技术对数字化后的《春秋经传》典籍进行关键词抽取探究,从而分析春秋经传的关键词分布情况.本文利用了三种关键词抽取算法,分别是基于无监督的TextRank算法、经典传统TF-IDF算法和LDA主题模型算法.基于Pooling的评价方法发现TextRank算法抽取的关键词结果更好,准确率达到84%.传统的TF-IDF算法和LDA主题模型算法准确率分别为62%和74%.同时,根据所抽取的关键词,可以发现春秋经传的记事内容主要围绕在诸侯国之间的聘问、会盟、征伐、婚丧、篡弑等.
数字人文、TextRank、关键词抽取、《春秋经传》
TP391.1;G350;G210.7
国家自然科学基金;国家社会科学基金
2020-12-24(万方平台首次上网日期,不代表论文的发表时间)
共9页
97-105