10.3969/j.issn.1671-1815.2015.06.017
基于Naive Bayes的中文人名识别研究
在传统的只统计人名用字的Naive Bayes分类算法的基础上,将人名上下文边界融入其中,并利用从大规模语料库中统计的人名用字、边界模板频率对人名定界,再通过扩散操作召回遗漏人名.该方法简单易行,并能取得很好的效果.实验结果表明,其F值达到了93.28%.
Naive Bayes分类算法、边界模板、人名识别
15
TP391.1(计算技术、计算机技术)
国家自然科学基金61363072;教育部人文社科基金11YJC740157,09YJC740027;江西省自然科学基金20114BAB201027
2015-04-03(万方平台首次上网日期,不代表论文的发表时间)
共5页
83-86,98