10.3969/j.issn.1002-137X.2007.06.062
统计自然语言处理中的线性插值平滑技术
统计自然语言处理中,一个很复杂的问题是数据稀疏问题.主要有两种平滑方法解决:回退法和线性插值法.本文分析和比较了几种典型的线性插值方法,着重研究了它们所引发的词性聚类倾向.在此基础上,给出了2种改进的平滑方法.实验表明,改进的方法比原来的方法有更出色的平滑效果.
统计语言模型、数据稀疏问题、平滑技术、回退法、线性插值法、n-gram
34
TP3(计算技术、计算机技术)
2007-07-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
223-225,244