10.3969/j.issn.1009-3125.2007.03.011
基于聚类分析的自然语言叙词表的自动构建
叙词表为信息标引和检索提供恰当的词汇选择及概念语义关系.手工编制词表费事费时,智力要求高,难以克服认知瓶颈.词表自动构建另辟蹊径,通过统计挖掘语料库中潜在的词汇语义关联.构建方法主要有合并现有词表、用户生成词表、通过语法分析自动构建词表、通过同现分析自动构建词表等.其中通过同现分析构建自然语言词表方法分为词汇收集、关联度计算、聚类分析三个阶段,该方法具有良好的应用前景,对中文信息检索系统具有重要的借鉴意义.
叙词表、自然语言、信息检索、自动构建、概念空间
16
G25(图书馆学、图书馆事业)
2007-09-03(万方平台首次上网日期,不代表论文的发表时间)
共6页
44-49