基于最大熵方法的中英文基本名词短语识别
使用了基于最大熵的方法识别中文基本名词短语.在开放语料Chinese TreeBank上,只使用词性标注,达到了平均87.43%/88.09%的查全率/准确率.由于,关于中文的基本名词短语识别的结果没有很好的可比性,又使用相同的算法,尝试了英文的基本名词短语识别.在英文标准语料TREEBANK Ⅱ上,开放测试达到了93.31%/93.04%的查全率/准确率,极为接近国际最优水平.这既证明了此算法的行之有效,又表明该方法的语言无关性.
最大熵、基本名词短语、自然语言处理
40
TP391(计算技术、计算机技术)
国家自然科学基金69873011;Intel中国研究中心资助项目
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
440-446