基于词汇支配度的汉语依存分析模型
如何应用句法结构和词汇化是句法分析建模所面临的两个主要问题,汉语依存分析对这两方面做了初步的探索.首先通过对大规模依存树库的统计学习,获取其中的词汇依存信息,建立了一个词汇化的概率分析模型.然后引入词汇支配度的概念,以充分利用了句子中的结构信息.词汇化方法有效地弥补了以前工作中词性信息的粒度过粗问题.同时,词汇支配度增强了对句法结构的识别,有效地避免了非法结构的生成.在4 000句的测试集上,依存分析获得了约74%的正确率.
依存语法、句法分析、支配度、动态规划
17
TP301(计算技术、计算机技术)
国家自然科学基金60435020;国家自然科学基金60575042;60503072
2006-09-29(万方平台首次上网日期,不代表论文的发表时间)
共8页
1876-1883