10.3969/j.issn.1009-8666.2014.12.014
基于语料库的汉语复合名词短语自动获取研究
汉语复合名词短语广泛存在于各种文体中,且绝大部分是低频的,这给复合名词短语的自动获取带来了很大的挑战性。文章针对统计指标不能有效获取低频复合名词短语的问题,提出了新的解决方法,将其视作一个分类问题,利用统计指标获取典型的、高频的复合名词短语作为训练数据,抽取多种特征,来帮助发现低频的复合名词短语,实验结果说明该思路是有效的。
复合名词短语、自动获取、SVM、统计指标
TP391(计算技术、计算机技术)
2015-01-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
57-62