结合句法组成模板识别汉语基本名词短语的概率模型
文中首先给出了汉语基本名词短语(baseNP)的形式化定义,并通过抽取baseNP句法组成模板,显示了这个定义的可操作性.文中指出,句法组成模板只是识别baseNP的必要条件,而非充要条件,仅靠句法组成模板并不能解决baseNP识别中的边界模糊歧义和短语类型歧义问题.据此,把体现baseNP内部组成的句法组成模板与体现上下文约束条件的N元模型结合起来,形成了汉语baseNP识别的新模型.实验证明,该模型的性能优于单纯基于词性标记的N元模型.
自然语言处理、语料库、基本名词短语
36
TP391(计算技术、计算机技术)
国家高技术研究发展计划863计划69433010
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
1384-1390