10.3969/j.issn.0490-6756.2009.03-020
基于统计的中文机构名自动识别
通过对中文机构名的语法语义特性进行分析,将中文机构名分成前部词和特征词,提出了一种基于统计的识别方法.使用成熟语料库的训练数据,计算候选机构名的特征词可信度、前部词首词可信度和前部词中部可信度,最终得到机构名构词可信度,并与给定阈值比较,实现了中文机构名识别.在开放性实验中,达到了85.57%的召回率和94.37%的准确率.
自然语言处理、中文机构名识别、前部词、特征词
46
TP391.1(计算技术、计算机技术)
2009-06-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
613-617