期刊专题

10.13663/j.cnki.lj.2020.11.014

数字人文下的先秦古汉语关键词抽取应用——以《春秋经传》为例

引用
数字人文作为一门交叉学科,其强调计算技术与人文学科融合发展.古汉语典籍是人文学科研究中重要的一部分,在此背景下,利用计算机技术对数字化后的《春秋经传》典籍进行关键词抽取探究,从而分析春秋经传的关键词分布情况.本文利用了三种关键词抽取算法,分别是基于无监督的TextRank算法、经典传统TF-IDF算法和LDA主题模型算法.基于Pooling的评价方法发现TextRank算法抽取的关键词结果更好,准确率达到84%.传统的TF-IDF算法和LDA主题模型算法准确率分别为62%和74%.同时,根据所抽取的关键词,可以发现春秋经传的记事内容主要围绕在诸侯国之间的聘问、会盟、征伐、婚丧、篡弑等.

数字人文、TextRank、关键词抽取、《春秋经传》

TP391.1;G350;G210.7

国家自然科学基金;国家社会科学基金

2020-12-24(万方平台首次上网日期,不代表论文的发表时间)

共9页

97-105

相关文献
评论
暂无封面信息
查看本期封面目录

图书馆杂志

1000-4254

31-1108/G2

2020,(11)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn