先秦古汉语典籍中的人名自动识别研究
以数字人文的文本挖掘和分析这一研究内容为切入点,通过条件随机场这一机器学习模型,在先秦语料库的基础上自动识别古汉语人名.在规模为187 901个词汇的先秦语料上,把调和平均值为91.52%的交叉验证语料所训练的模型确定为古汉语人名自动识别的最优模型,并进行实验验证.本研究不仅有助于先秦古文献命名实体的抽取,而且也有益于其他人文学科对先秦人物关系和背景的探究.
条件随机场、古汉语人名、特征模板、先秦语料库
TP391;G353.1(计算技术、计算机技术)
2013-09-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
63-68