期刊专题

10.3969/j.issn.1002-1965.2021.10.015

数字技术下《老子》文本与先秦两汉典籍的关系挖掘

引用
[目的/意义]理解老子思想关乎理解中国早期文化,结合数字人文的方法,开展实证研究.利用大数据计算的方式,通过定量统计、定性分析,解决老子研究领域长期存在的疑而难决的源头、影响等方面的问题,发掘依靠阅读经验难以发现的文本组织特征及相互关系.[方法/过程]统计河上公版《老子》语料的字频;进行相似度分析和典籍引用情况分析;最后训练出古汉语的BERT模型,利用生成的字嵌入计算典籍句子之间的相似程度,在《老子》之前的典籍上进行相关性研究.[结果/结论]使用TF-IDF进行文本向量化,得出《老子》与其后世的作品中的《淮南子》最为相似;使用BERT模型的自监督学习训练,达到在完形填空任务上52.11%的精度和在预测是否是下一个句子上98.45%的精度,相似度计算结果显示出《墨子》与《老子》密切相关.这种方法引起了我们对《老子》和《墨子》间论说思想关系的一番新思考.

BERT;数字人文;相似度;关系挖掘;先秦;老子

40

TP393;G251(计算技术、计算机技术)

国家社会科学重大基金项目"中国诸子学通史";国家社会科学基金项目"《经典释文》音义辞典";华东师大幸福之花先导基金重大研究专项"'幸福之花'先导研究基金项目——大数据视野下的老子思想源头与涵义研究"

2021-11-08(万方平台首次上网日期,不代表论文的发表时间)

共9页

99-107

相关文献
评论
暂无封面信息
查看本期封面目录

情报杂志

1002-1965

61-1167/G3

40

2021,40(10)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn