10.3321/j.issn:0254-4164.2004.09.007
关键词自动标引的最大熵模型应用研究
关键词是文档管理、文本聚类/分类、信息检索等领域可利用的重要资源,因此该文提出了利用最大熵模型进行自动标引的技术.最大熵模型为一个成熟的数学模型,已经应用到计算语言学的各个领域.然而它的应用非常灵活,针对标引任务和现有资源的实际情况,作者首先建立了最大熵模型的特征集合,然后提出了三种试验方法,并给出了相应的试验结果,最后针对最大熵模型在关键词自动标引任务中的应用做了有益的分析和探讨.该研究对于关键词标引研究以及最大熵在其他领域中的应用将有所启示.
关键词标引、关键词抽取、最大熵模型、信息抽取
27
TP391(计算技术、计算机技术)
国家高技术研究发展计划863计划2001AA114210-05;国家重点基础研究发展计划973计划G1998030504-01,G1998030507-4
2004-11-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
1192-1197