基于汉文体计量特征的《日本书纪》各卷分类研究

引用

摘要：

《日本书纪》是日本现存最早用汉字和汉文编纂的史书.从语言的角度来看,该书各卷所使用的汉文体呈现出了不同的特点.前人根据万叶假名的汉字及音韵系统、天皇即位和定都的叙事风格、天文天象的记载情况、语言表达的语法问题等尝试对该书各卷进行划分,但是这种分类不能够系统反映各卷的汉文体特点,也无法对第1卷、第2卷、第30卷进行划分.常用字词的使用和分布可反映文章的行文特点,本文利用无指导机器学习技术对这些汉文体语言特征进行聚类分析并和《隋书》进行对比发现,《日本书纪》30卷的汉文体可以分成4类,部分结果和前人研究结果一致.新的发现是,《日本书纪》第1、2、3卷的汉文体和《隋书》一致;第14卷至30卷(第23卷除外)和《隋书》相似;第5卷至13卷以及第23卷和《隋书》差距较大;第4卷的行文不但和《隋书》不同,也和《日本书纪》其他各卷有很大差距.通过对《日本书纪》和《古事记》汉文体的研究也证明,前沿的语言智能技术可以在古文献研究中发挥作用.

关键词：日本书纪、隋书、汉文体、文本聚类

分类号：S718.5;S543.9;S153

资助基金：国家社会科学基金14ZDB085

在线出版日期：2024-09-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共14页

页码：12-25

英文信息展示

期刊专题