一种基于词典的搜索引擎系统动态更新模型
基于词汇标注的特征项提取方法是中文信息处理的有效方法,但词汇的析取是基于词典的, 词典的涵盖程度决定了词汇切分的准确率. 因而不断地学习新词汇、动态地维护词典,使整个中文信息处理系统具有自适应性和动态性就成了一个关键问题. 以搜索引擎系统为例, 提出了一种基于词典动态变化的搜索引擎系统更新理论模型和实现模型. 相关实验表明,该模型对缩短搜索引擎信息库的更新时间、提高查询准确率等方面十分有效.
搜索引擎、自然语言处理、中文信息处理、万维网
37
TP391;TP393.4(计算技术、计算机技术)
国家科技攻关项目96-743-01-05-01
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
1265-1270