10.3969/j.issn.1671-1815.2008.17.025
Nutch-0.9中JE中文分词的实现
Nutch是一个开放源代码的Web搜索引擎,基于开源搜索框架Lucene,扩展性较好.Nutch是针对英文开发的,对中文只进行单字切分.通过分析Nutch的语言分析器结构,结合基于词库的正向最大匹配分词算法的JE分词,实现了Nutch的中文分词.
Nutch、Lucene、JE分词、中文分词
8
TP391.3(计算技术、计算机技术)
2008-11-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
4881-4884,4890