10.3969/j.issn.1003-3513.2006.02.002
一种基于数字图书馆的文本信息标引技术的改进研究
研究构建了具有位置信息控制的特义禁用词语义环境,进而运用于中文文献元数据CXMARC文本的自动标引和主题信息的数据挖掘,其中研究设计的预处理特义中文禁用字词切分算法SWF,能有效地减少领域的分词歧义性和缩短标引时间,从而改进了传统最大匹配MM算法的自动标引质量和效率.
自动标引、数字图书馆、中文信息处理、MARC文本
G25(图书馆学、图书馆事业)
国家社会科学基金05BTQ011
2007-05-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
5-9