10.3969/j.issn.1002-137X.2006.11.061
基于类语言模型的中文机构名称自动识别
提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来.在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来.在实验过程中,逐步增加实验条件,依次加入启发信息、缓存模型和机构名缩写处理,使得实验结果显著提高.在开放测试中,中文机构名称最终识别的查准率和查全率分别为85.47%和72.81%.
类语言模型、中文机构名称识别、启发信息、Viterbi算法
33
TP3(计算技术、计算机技术)
高等学校博士学科点专项科研项目20050007023
2006-12-07(万方平台首次上网日期,不代表论文的发表时间)
共3页
212-214