一种特征匹配方法:稀疏特征树
在大规模或实时环境要求下,机器学习算法的计算效率非常重要.描述了用于最大熵模型执行系统的一种高效的数据结构及其相关的生成和查找算法.这种数据结构称为稀疏特征树,用于表示特征集合,以提高特征查找(或特征匹配)的速度,从而提高概率计算和执行系统的速度.基本短语识别和词性标注的实验显示,这种新的数据结构的确能够极大地加快最大熵方法执行系统的速度,同时保持空间复杂度不变.
稀疏特征树、最大熵模型、特征匹配
17
TP181(自动化基础理论)
中国科学院资助项目60435020
2006-05-29(万方平台首次上网日期,不代表论文的发表时间)
共8页
1026-1033